l@pteff
20.11.2015 - 15:53
Добрый день, парсинг результатов поискового запроса не работает если в запросе есть двоеточие, например так все нормально парсит:
$uri = 'http://nova.rambler.ru/search?query='.urlencode($_GET['text']).'&pagelen=30';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $uri);
а так уже нет (запрос это title:значение $_GET['text']):
$uri = 'http://nova.rambler.ru/search?query=title%3A'.urlencode($_GET['text']).'&pagelen=30';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $uri);
Можно ли как-нибудь решить проблему с двоеточием?
l@pteff
24.11.2015 - 12:48
Удалось выяснить, что страница Рамблера, возвращаемая curl'ом, имеет неверные региональные настройка (Ваш город: Германия). В настройках рамблера в браузере регион установлен верно.
Как можно изменить регион с помощью curl либо вернуть каким-нибудь образом из своих настроек?
Игорь_Vasinsky
24.11.2015 - 13:05
причём тут регион.. уф
регион там меняется в настройках поиска. отследи куда и что отправляется при указании региона
потом делай свой поисковый запрос.
_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
l@pteff
24.11.2015 - 16:33
та это понятно, только там особо никакой формы нет, задание региона в iframe, что куда отправляется пока что-то не соображу:
http://joxi.ru/a2XO4OMSxDKLmg