[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Проверка бота
vestmar
Добрый день, кому не трудно растолкуйте в двух словах как это работает)
Вроде как это проверка на бота, и всё элементарно stristr ищет|возвращает подстроку

$ref = $_SERVER['HTTP_REFERER'];
$server_query_string = $_SERVER['QUERY_STRING'];

if (!empty($server_query_string))
{
if(stristr($ref,$server_query_string)) {
//$is_human = false;
echo "is bot";
}
}


Актуальная ли сейчас эта проверка, я сколько не проверял, ничего выводит, если смотреть через сервисы гугла.
killer8080
хрень какая то, а не проверка от ботов.
Боты прекрасно умеют подделывать реферер, а его отсутствие ни о чем не говорит. Многие анонимайзеры его режут, на этот заголовок вообще полагаться нельзя.
GET
В принципе вообще никак нельзя определить, любые заголовки можно подделать. Мне кажется лучше просто ориентироваться на USER_AGENT, а иногда вообще можно даже не вести список ботов, а просто ориентироваться на слово 'bot'.

Кстати, может код ТС`а связан с принудительным рефером страницы, который должен определить работают ли куки у юзера, а здесь его только вторая, какая-то проверочная часть?

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
killer8080
Цитата (ABC @ 17.10.2014 - 14:14)
В принципе вообще никак нельзя определить

и да, и нет.
Ботов можно отсеивать по способности обрабатывать js, подавляющее большинство из них этого не умеют, а гиганты вроде яндекса и гула, свои юзер агенты не маскируют под юзеров (вроде).
Ещё один способ, анализировать запросы к css файлам, боты обычно ими не интересуются, а браузеры всегда дергают (если из кеша не берут)
GET
Цитата
Ботов можно отсеивать по способности обрабатывать js, подавляющее большинство из них этого не умеют, а гиганты вроде яндекса и гула, свои юзер агенты не маскируют под юзеров (вроде).


Кстати, вопрос в тему. Почему до сих пор не у всех популярных ботов USER_AGENT обязательно не содержит слово 'bot' или вообще, какой-нибудь идентификационный знак, договорились бы, чтоб облегчить жизнь? Даже у гугла есть боты без слова bot.

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
killer8080
Цитата (ABC @ 17.10.2014 - 14:29)
Кстати, вопрос в тему. Почему до сих пор не у всех популярных ботов USER_AGENT обязательно не содержит слово 'bot' или вообще, какой-нибудь идентификационный знак

ну у них больше популярен термин crawler, чем bot видимо.

vestmar
действительно хрень, в самом скрипте что я нашёл это 3-ая проверка бота
1.ip
2.user agent
3.хрень.

>css боты обычно ими не интересуются
это действительно так.

>на этот заголовок вообще полагаться нельзя.
Спасибо! это я учту.

Но рефер и другие данные передаются гуглом, в таком ключе

с выдачи человек заходит на сайт, там его перекидывает если не бот, и на последнем пункте в строке присутствуют (ключ и откуда пришёл). Всё окей вроде.

Ладно, разберёмся)
killer8080
Цитата (vestmar @ 17.10.2014 - 14:48)
с выдачи человек заходит на сайт, там его перекидывает если не бот, и на последнем пункте в строке присутствуют (ключ и откуда пришёл). Всё окей вроде.

клоакинг что ли? Лучше с этим завязывай, пока поисковики тебя не забанили smile.gif
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.