Я хотел бы обнаружить (на стороне сервера), какие запросы от ботов. На данный момент меня не волнуют злые боты, просто те, которые играют хорошо. Я видел несколько подходов, которые в основном связаны с совпадением строки пользовательского агента с такими ключевыми словами, как "бот". Но это кажется неудобным, неполным и неподвластным. Так у кого-то есть более прочные подходы? Если нет, есть ли у вас какие-либо ресурсы, которые вы используете, чтобы быть в курсе всех дружественных пользовательских агентов?
Если вам интересно: я не пытаюсь сделать что-либо против какой-либо политики в поисковых системах. У нас есть раздел сайта, где пользователь случайным образом представлен одной из нескольких немного разных версий страницы. Однако, если обнаружен веб-искатель, мы всегда предоставляем им одну и ту же версию, чтобы индекс был согласован.
Также я использую Java, но я бы предположил, что подход будет схожим для любой серверной технологии.