[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: cURL parser
Nightmare
Здравствуйте.
С помощью cURL пытаюсь спарсить сайт, но в ответ ничего не выдает.
Пример:
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $link);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Googlebot/2.1 (http://www.googlebot.com/bot.html)');
curl_setopt($ch, CURLOPT_AUTOREFERER, true);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_FORBID_REUSE, 1);
curl_setopt($ch ,CURLOPT_FOLLOWLOCATION, 1);
$content = curl_exec($ch);
echo "<pre>";
$regularExp = "/<body>(.*)<\/body>/isU";
preg_match_all($regularExp, $content, $matches, PREG_PATTERN_ORDER);
print_r($matches);


пустой массив. Может юзер агент не тот, или что-то еще, подскажите



Спустя 2 минуты, 7 секунд (9.06.2011 - 15:52) Nightmare написал(а):
Array
(
[0] => Array
(
[0] =>
Moved Permanently


The document has moved here.



Apache/1.3.41 Server at www.some_site Port 80


)

[1] => Array
(
[0] =>
Moved Permanently


The document has moved here.



Apache/1.3.41 Server at www.some_site Port 80

Спустя 9 минут, 30 секунд (9.06.2011 - 16:02) DedMorozzz написал(а):
Задай заголовки. И включи куки, мало ли они пишутся

Спустя 23 минуты, 9 секунд (9.06.2011 - 16:25) Nightmare написал(а):
пример можно?

Спустя 36 минут, 37 секунд (9.06.2011 - 17:02) DedMorozzz написал(а):
$header[] = "Host: %HOST_NAME%";
$header[] = "User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13";
$header[] = "X-Requested-With: XMLHttpRequest";
$header[] = "X-Prototype-Version: 1.6.0.2";
$header[] = "Referer: http://%REFERER%/";

Спустя 1 час, 54 минуты, 3 секунды (9.06.2011 - 18:56) walerus написал(а):
Навряд ли куки требуются, что за сайт? и правильная ли регулярка... ?

Спустя 4 минуты, 15 секунд (9.06.2011 - 19:00) DedMorozzz написал(а):
В регулярке нечему быть не правильному, разве что модификатор U - как минимум лишний

Спустя 6 часов, 9 минут, 14 секунд (10.06.2011 - 01:09) walerus написал(а):
Цитата (DedMorozzz @ 9.06.2011 - 16:00)
В регулярке нечему быть не правильному, разве что модификатор U - как минимум лишний

Боди может писаться и так
<body bgcolor="#FDFEFD">
, по этой причине уточнил, т.к. ТС, пример кода - не привел...

Спустя 9 часов, 26 минут, 26 секунд (10.06.2011 - 10:36) DedMorozzz написал(а):
А, вот о чём ты. Да таковое более чем вероятно. Иль какое нить событие вполне может быть.
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.