vestmar
17.10.2014 - 13:45
Добрый день, кому не трудно растолкуйте в двух словах как это работает)
Вроде как это проверка на бота, и всё элементарно stristr ищет|возвращает подстроку
$ref = $_SERVER['HTTP_REFERER'];
$server_query_string = $_SERVER['QUERY_STRING'];
if (!empty($server_query_string))
{
if(stristr($ref,$server_query_string)) {
echo "is bot";
}
}
Актуальная ли сейчас эта проверка, я сколько не проверял, ничего выводит, если смотреть через сервисы гугла.
killer8080
17.10.2014 - 14:06
хрень какая то, а не проверка от ботов.
Боты прекрасно умеют подделывать реферер, а его отсутствие ни о чем не говорит. Многие анонимайзеры его режут, на этот заголовок вообще полагаться нельзя.
В принципе вообще никак нельзя определить, любые заголовки можно подделать. Мне кажется лучше просто ориентироваться на USER_AGENT, а иногда вообще можно даже не вести список ботов, а просто ориентироваться на слово 'bot'.
Кстати, может код ТС`а связан с принудительным рефером страницы, который должен определить работают ли куки у юзера, а здесь его только вторая, какая-то проверочная часть?
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
killer8080
17.10.2014 - 14:20
Цитата (ABC @ 17.10.2014 - 14:14) |
В принципе вообще никак нельзя определить |
и да, и нет.
Ботов можно отсеивать по способности обрабатывать js, подавляющее большинство из них этого не умеют, а гиганты вроде яндекса и гула, свои юзер агенты не маскируют под юзеров (вроде).
Ещё один способ, анализировать запросы к css файлам, боты обычно ими не интересуются, а браузеры всегда дергают (если из кеша не берут)
Цитата |
Ботов можно отсеивать по способности обрабатывать js, подавляющее большинство из них этого не умеют, а гиганты вроде яндекса и гула, свои юзер агенты не маскируют под юзеров (вроде). |
Кстати, вопрос в тему. Почему до сих пор не у всех популярных ботов USER_AGENT обязательно не содержит слово 'bot' или вообще, какой-нибудь идентификационный знак, договорились бы, чтоб облегчить жизнь? Даже у гугла есть боты без слова bot.
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
killer8080
17.10.2014 - 14:35
Цитата (ABC @ 17.10.2014 - 14:29) |
Кстати, вопрос в тему. Почему до сих пор не у всех популярных ботов USER_AGENT обязательно не содержит слово 'bot' или вообще, какой-нибудь идентификационный знак |
ну у них больше популярен термин crawler, чем bot видимо.
vestmar
17.10.2014 - 14:48
действительно хрень, в самом скрипте что я нашёл это 3-ая проверка бота
1.ip
2.user agent
3.хрень.
>css боты обычно ими не интересуются
это действительно так.
>на этот заголовок вообще полагаться нельзя.
Спасибо! это я учту.
Но рефер и другие данные передаются гуглом, в таком ключе
с выдачи человек заходит на сайт, там его перекидывает если не бот, и на последнем пункте в строке присутствуют (ключ и откуда пришёл). Всё окей вроде.
Ладно, разберёмся)
killer8080
17.10.2014 - 14:56
Цитата (vestmar @ 17.10.2014 - 14:48) |
с выдачи человек заходит на сайт, там его перекидывает если не бот, и на последнем пункте в строке присутствуют (ключ и откуда пришёл). Всё окей вроде. |
клоакинг что ли? Лучше с этим завязывай, пока поисковики тебя не забанили
Быстрый ответ:
Powered by dgreen
Здесь расположена полная версия этой страницы.