[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Парсинг google
Crystallon
Доброго времени суток!
Пытаюсь парсить гугл, точнее с парсингом проблем нет, если бы не капча.
С капчей ситуация следующая:
Вместо выдачи перенаправляет на:
http://www.google.com/sorry/
беру от туда id капчи и загружаю картинку от сюда:
http://www.google.com/sorry/image?id={$id}&hl=en
Картинка успешно распознается антигейтом и я получаю код.
А вот с этого момента начинаются проблемы - гугл принимать капчу упорно отказывается и после отправки ему капчи сим образом:
http://www.google.com/sorry/Captcha?id={&#...www.google.com/
он снова выдает страницу ввода капчи.

Уже 20 раз перепроверил где какие куки в браузере берутся, как какая ссылка выглядит итп, но упорно не работает...
Подскажите пожалуйста в чем могут быть грабли, наверняка многие имели дело с парсингом гугла.
Заранее спасибо!

P.S. Код не прикладываю т.к. дело тут не в коде, а в том что мне нужно понять как гугл определяет что я пытаюсь его парсить.
rizhiy87
Была похожая проблема. Решил введением таймаута между запросами. Их капчу победить так и не удалось sad.gif
Игорь_Vasinsky
Цитата
Пытаюсь парсить гугл, точнее с парсингом проблем нет, если бы не капча.


упалподстол.


машина то рабочая, еслиб движок был.


не парься - гугл тебе не по зубам.

только таймауты, и то не факт

_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.