[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Не получается спарсить значение в google
burenka
Хочу узнать количество страниц в индексе google. Вчера скачал пример но он выдает почемуто ноль. Вот скрипт

function grab($site)
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $site);
curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
$data = curl_exec($ch);
curl_close($ch);
if ($data) return $data; else return FALSE;
}

function g_stat($url){
$file=grab('https://www.google.ru/search?q=site:'.$url);
if (preg_match("!<div id=\"resultStats\">Результатов: (.*?)<nobr>!si", $file, $ok)) {
$link=$ok[1];
$link=str_replace("примерно", "", $link);
$link=str_replace(" ", "", $link);
$link=str_replace(",", "", $link);
} else {
if(preg_match("!ничего не найдено!si",$file)){
$link="0";
}
else {
$link="0";
}
}

return $link;
}

$url = 'google.ru';
if (substr($url, 0, 7) ==" http://")
$url = str_replace("http://", "", $url);
if (substr($url, 0, 4) == "www.")
$url = str_replace("www.", "", $url);
echo(str_replace(" ", "", g_stat($url)));
$file хранит в себе положенное значение, без всяких предупреждений от google. И регулярка вроде бы впорядке. смотрел исходный код странички все осталось по прежнему. В чем проблема не знаю или это гугл подлянку сделал, хотя как я уже говорил переменная $file хранит нужное значение. Помогите пожалуйста.
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.