[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: GoogleBot создает несуществующий адрес + html файл
Страницы: 1, 2
GET
Привет.

У меня есть ссылки вида: http://site.com/?dot=45

GoogleBot сканит их как:
http://site.com/kefopifwfwef.html?dot=45

т.е. подставляет в запрос сгенерированное им имя файла, я правильно понимаю, что он, когда в следущий раз обходит и генерит другое имя:
http://site.com/fffffffffffffff.html?dot=45

Не объявляет эту страницу дубликатом т.е. как другую?

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
inpost
GET
Ну для начала это 2 разных страницы, но если контент в них одинаковый, то будет отмечать как дублирование, от него лучше избавляться.

_____________
Обучаю веб-программированию качественно и не дорого: http://school-php.com
Фрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
GET
inpost
Цитата
Ну для начала это 2 разных страницы


Дак он же сам подставляет kefopifwfwef.html и fffffffffffffff.html я подумал это ему технически нужно, а у себя в базах адрес так и идет, как http://site.com/?dot=45ъ

Все перерыл не могу найти прочитать про это.

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
Invis1ble
ну например ты сам ввел в адресную строку браузера случайно этот адрес
а гугл-бот - он такой, пошел и проверил, а что это там от него прячут smile.gif

_____________

Профессиональная разработка на заказ

Я на GitHub | второй профиль

inpost
GET
Ну откуда-то же он придумал эти страницы? Где-то есть ссылка на fffff, там есть ссылка на ffff?dot=45. Ну или кто-то их открывал. В любом случае ты должен контроллировать все свои ссылки очень жестко.

_____________
Обучаю веб-программированию качественно и не дорого: http://school-php.com
Фрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
S.Chushkin
Вариант: некий бот косит под гуглобота. Проверить ИП - если не гуглобот, то забить или забанить, если удастся.

_____________
Рекламка / ad.pesow.com Хрень / mr-1.ru
GET
Блин, вы что хотите сказать, что это не ГУГЛБОТ генерирует эти ссылки, а откуда - то их берет или это вообще кто-то косит под ГУГЛ БОТА..IP ГУГЛБОТОВСКИЕ!

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
brevis
Похоже, что он таким образом чекает отдаешь ли ты 404 для несуществующих URL'ов.

_____________
Чатик в телеге
GET
Цитата
Похоже, что он таким образом чекает отдаешь ли ты 404 для несуществующих URL'ов.


ТОЧНО!!!

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
inpost
GET
"В любом случае ты должен контроллировать все свои ссылки очень жестко."
Если ты не понял этой фразы, то уточню. Речь идёт об 404, 301, shortlink, next+prew pages и canonical.

_____________
Обучаю веб-программированию качественно и не дорого: http://school-php.com
Фрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
GET
Цитата
"В любом случае ты должен контроллировать все свои ссылки очень жестко."
Если ты не понял этой фразы, то уточню. Речь идёт об 404, 301, shortlink, next+prew pages и canonical.

inpost

Да, да, спасибо я как раз сейчас навожу там порядок. smile.gif

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
GET
Топну тему.

Помогите разобраться, второй день гуглю на английском и не могу найти: "Откуда гугл бот генерит адреса"?

У меня на всех ссылка сайта адрес
не
href="mysite.com/index.php?article=5454"
а
href="mysite.com/?article=5454"

т.к. все входит через один узел, убрал index.php прямо в документах (специально не стал делать вариант, когда index.php есть, но редирект с index.php его как-бы подменяет т.к. не понятен смысл, когда и так все логично).

Раньше запарился и забыл закрыть 404 с вариантом с index.php, сейчас все сделано, но вижу, как гугл бот долбится по адресу:

mysite.com/snsfedppofjefefpj.html?article=5454

Я не могу понять откуда он его берет?

Все остальные боты нормально воспринимают эти ссылки, да и сам Гугл бот обычно нормально, но иногда по таким вот запросам.

Инфу не могу найти, что он делает?

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
GET
Отрыл вот тему, там тоже ребята склоняются, что это проверка на вшивость.

https://www.linux.org.ru/forum/web-development/11445739

и вот:

https://forums.digitalpoint.com/threads/goo...is-new.1601612/

и вот:

http://ubuntuforums.org/archive/index.php/t-1724948.html

Самое интересное, что никто точно не знает, тех служба молчит.

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
GET
Веду переписку на американском гугл форуме с их разработчиками. При помощи гугл переводчика. Все ржут, я в шоке, никто не знает почему он так делает, пишут, что 404 не плохо, типа успокойся. smile.gif))))))

_____________
Не тот велик, кто не падал, а тот кто падал и поднимался.
paul85
GET, почему ржут? Это не свойственно американцам.


Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.