Привет.
У меня есть ссылки вида:
http://site.com/?dot=45GoogleBot сканит их как:
http://site.com/kefopifwfwef.html?dot=45т.е. подставляет в запрос сгенерированное им имя файла, я правильно понимаю, что он, когда в следущий раз обходит и генерит другое имя:
http://site.com/fffffffffffffff.html?dot=45Не объявляет эту страницу дубликатом т.е. как другую?
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
inpost
26.04.2015 - 19:15
GETНу для начала это 2 разных страницы, но если контент в них одинаковый, то будет отмечать как дублирование, от него лучше избавляться.
_____________
Обучаю веб-программированию качественно и не дорого:
http://school-php.comФрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
inpost
Цитата |
Ну для начала это 2 разных страницы |
Дак он же сам подставляет kefopifwfwef.html и fffffffffffffff.html я подумал это ему технически нужно, а у себя в базах адрес так и идет, как
http://site.com/?dot=45ъВсе перерыл не могу найти прочитать про это.
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
Invis1ble
26.04.2015 - 19:24
ну например ты сам ввел в адресную строку браузера случайно этот адрес
а гугл-бот - он такой, пошел и проверил, а что это там от него прячут
_____________
Профессиональная разработка на заказЯ на GitHub |
второй профиль
inpost
26.04.2015 - 19:26
GETНу откуда-то же он придумал эти страницы? Где-то есть ссылка на fffff, там есть ссылка на ffff?dot=45. Ну или кто-то их открывал. В любом случае ты должен контроллировать все свои ссылки очень жестко.
_____________
Обучаю веб-программированию качественно и не дорого:
http://school-php.comФрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
S.Chushkin
26.04.2015 - 19:28
Вариант: некий бот косит под гуглобота. Проверить ИП - если не гуглобот, то забить или забанить, если удастся.
_____________
Рекламка / ad.pesow.com Хрень / mr-1.ru
Блин, вы что хотите сказать, что это не ГУГЛБОТ генерирует эти ссылки, а откуда - то их берет или это вообще кто-то косит под ГУГЛ БОТА..IP ГУГЛБОТОВСКИЕ!
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
brevis
26.04.2015 - 19:41
Похоже, что он таким образом чекает отдаешь ли ты 404 для несуществующих URL'ов.
_____________
Чатик в телеге
Цитата |
Похоже, что он таким образом чекает отдаешь ли ты 404 для несуществующих URL'ов. |
ТОЧНО!!!
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
inpost
26.04.2015 - 20:01
GET"В любом случае ты должен контроллировать все свои ссылки очень жестко."
Если ты не понял этой фразы, то уточню. Речь идёт об 404, 301, shortlink, next+prew pages и canonical.
_____________
Обучаю веб-программированию качественно и не дорого:
http://school-php.comФрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
Цитата |
"В любом случае ты должен контроллировать все свои ссылки очень жестко." Если ты не понял этой фразы, то уточню. Речь идёт об 404, 301, shortlink, next+prew pages и canonical. |
inpostДа, да, спасибо я как раз сейчас навожу там порядок.
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
Топну тему.
Помогите разобраться, второй день гуглю на английском и не могу найти: "Откуда гугл бот генерит адреса"?
У меня на всех ссылка сайта адрес
не
href="mysite.com/index.php?article=5454"
а
href="mysite.com/?article=5454"
т.к. все входит через один узел, убрал index.php прямо в документах (специально не стал делать вариант, когда index.php есть, но редирект с index.php его как-бы подменяет т.к. не понятен смысл, когда и так все логично).
Раньше запарился и забыл закрыть 404 с вариантом с index.php, сейчас все сделано, но вижу, как гугл бот долбится по адресу:
mysite.com/snsfedppofjefefpj.html?article=5454
Я не могу понять откуда он его берет?
Все остальные боты нормально воспринимают эти ссылки, да и сам Гугл бот обычно нормально, но иногда по таким вот запросам.
Инфу не могу найти, что он делает?
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
Отрыл вот тему, там тоже ребята склоняются, что это проверка на вшивость.
https://www.linux.org.ru/forum/web-development/11445739и вот:
https://forums.digitalpoint.com/threads/goo...is-new.1601612/и вот:
http://ubuntuforums.org/archive/index.php/t-1724948.htmlСамое интересное, что никто точно не знает, тех служба молчит.
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
Веду переписку на американском гугл форуме с их разработчиками. При помощи гугл переводчика. Все ржут, я в шоке, никто не знает почему он так делает, пишут, что 404 не плохо, типа успокойся.
))))))
_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
paul85
29.04.2015 - 02:20
GET, почему ржут? Это не свойственно американцам.