[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Как перекидывать инфу с чужих сайтов на свой
Вежливый гость
Здравствуйте! Наверное, это называется "Грабить страницы", не знаю точно терминов. Допустим, на одном спортивном сайте есть турнирная таблица, как можно её брать себе скриптом? а не вручную с исходного кода...



Спустя 1 минута, 39 секунд (27.09.2010 - 14:32) tmt0086 написал(а):
парсер - чудо воровства biggrin.gif

Спустя 1 минута, 14 секунд (27.09.2010 - 14:33) Guest написал(а):
и как же парсить с исходного кода страницы? а?

Спустя 37 секунд (27.09.2010 - 14:33) tmt0086 написал(а):
дай страницу, откуда хочешь тырить, я примерный код намаляю(и что тырить хошь тоже напиши)

Спустя 8 минут, 10 секунд (27.09.2010 - 14:42) Guest написал(а):
http://news.sportbox.ru/Vidy_sporta/Futbol

Там есть ТУРНИРНАЯ ТАБЛИЦА Россия. Чемпионат России. Премьер-лига. 2010

Спустя 5 минут, 8 секунд (27.09.2010 - 14:47) tmt0086 написал(а):
<?
$fp = fsockopen('www.news.sportbox.ru', 80);
if ($fp) {
$header = "GET /Vidy_sporta/Futbol HTTP/1.0\r\n";
$header .= "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8\r\n";
$header .= "Accept-Language: ru-RU,ru;q=0.9,en;q=0.8\r\n";
$header .= "User-Agent: Mozilla/4.0 (compatible; MSIE 9.0; Windows NT 5.1)\r\n";
$header .= "Connection: Keep-Alive\r\n";
$header .= "Host: www.news.sportbox.ru\r\n\r\n";
fputs($fp, $header);
while (!feof($fp))
$content .= fgets($fp, 1024);
}
fclose($fp);
$res=preg_replace(".*?<div class=\"spb_cmp_col_table spb_cmp_base_style\">","<div class=\"spb_cmp_col_table spb_cmp_base_style\">",$content);
$res1=preg_replace("Полная таблица</a></div></div>.*?</html>","Полная таблица</a></div></div>",$res);
print_r($res1);
?>

Спустя 1 минута, 37 секунд (27.09.2010 - 14:48) Guest написал(а):
Warning: preg_replace() [function.preg-replace]: No ending delimiter ''' found in K:\home\test1.ru\www\f\index.php on line 16

Warning: preg_replace() [function.preg-replace]: No ending delimiter ''' found in K:\home\test1.ru\www\f\index.php on line 17

Спустя 7 минут, 47 секунд (27.09.2010 - 14:56) DedMorozzz написал(а):
в прег реплейсе укажи "#" после открытой кавычки. И до последней закрытой.

Спустя 1 минута, 44 секунды (27.09.2010 - 14:58) tmt0086 написал(а):
DedMorozzz попробовал, ошибка..

Спустя 1 минута, 23 секунды (27.09.2010 - 14:59) Guest написал(а):
Не получается, напишите кто-нить нормально

Спустя 11 секунд (27.09.2010 - 14:59) tmt0086 написал(а):
а нет, вру.. у меня выдало вообще "HTTP/1.1 302 Moved Temporarily Server: nginx Date: Mon, 27 Sep 2010 11:58:58 GMT Content-Type: text/html Connection: close Location: http://news.sportbox.ru/Vidy_sporta/Futbol
302 Found
nginx"

Спустя 26 секунд (27.09.2010 - 15:00) Guest написал(а):
tmt0086

Где код взял-то? Дай ссылку

Спустя 1 минута, 10 секунд (27.09.2010 - 15:01) tmt0086 написал(а):
писал.. где где.. вот http://phpforum.ru/index.php?showtopic=34251

Спустя 1 минута, 21 секунда (27.09.2010 - 15:02) Guest написал(а):
А ошибки исправить не можешь свои, как говоришь?)

Спустя 1 минута, 7 секунд (27.09.2010 - 15:03) tmt0086 написал(а):
скрипт то рабочий, но вот защита видимо от людей, которые воруют.. если ошибку 302 выдает

Спустя 1 минута, 26 секунд (27.09.2010 - 15:05) Guest написал(а):
можешь написать исправленный вариант кода с #

Спустя 38 минут, 35 секунд (27.09.2010 - 15:43) Rand написал(а):
tmt0086
Здесь сайт надо писать без WWW

Спустя 14 часов, 17 минут, 56 секунд (28.09.2010 - 06:01) ASerputko написал(а):
В свое время делал грабер гороскопа с сайта i.ua
использовал такого рода скрипт:


/*Собираем гороскоп про Овнов*/
// Это страница, где воруем

$url = "http://goroskop.i.ua/aries/";
// Начальный кусок html кода, с него начинает грабер копировать
$unique_start = '<p class="marginR1 large">';
// Конечный кусок html, тут грабер заканчивет копирование
$unique_end = '</p>';

// Наша функция
function grabber($url, $unique_start, $unique_end)
{
$code = file_get_contents($url);
preg_match('/'.preg_quote($unique_start,'/').'(.*)'.preg_quote($unique_end, '/').'/Us', $code, $match);
return $match[1];
}

// Все что получилось заганяем в переменную
$aries = grabber($url, $unique_start, $unique_end);

Спустя 1 час, 32 минуты, 10 секунд (28.09.2010 - 07:34) Joker написал(а):
почему вас не кто не учит таким вещам как:

Воровать не хорошо!

Не спрашивать как украсть у тех у кого хочешь красть!
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.