У меня такая проблема, хочу вытащить из википедии определённый участок(например текст между <p></p>).
Я так то раскидал небольшой граббер, но что то у меня не получается....
Вот код:
<?php
// получаем Web-страницу с новостью
// переменная $u содержит URL страницы
$u="http://ru.wikipedia.org/wiki/php";
$f=join('<BR>', file($u));
// начало новости
$begin=strpos(strtolower($f), "<p>", 0);
// конец новости
$end=strpos(strtolower($f), '</p>', $begin);
// вырезаем то, что нам нужно - текст новости
$txt=substr($f, $begin, $end-$begin);
// удаляем все теги, кроме <p> и <img>
$txt = strip_tags($txt, '<p><img>');
// выводим текст новости
echo $txt;
?>
но при тестировании выходит такая ошибка:
Warning: file(http://ru.wikipedia.org/wiki/php) [function.file]: failed to open stream: HTTP request failed! HTTP/1.0 403 Forbidden in C:\Program Files (x86)\VertrigoServ\www\1\index.php on line 6
Warning: join() [function.join]: Invalid arguments passed in C:\Program Files (x86)\VertrigoServ\www\1\index.php on line 6
Прошу вас поправить мой кривой код пожалуйста, заранее благодарен!:)
ЗЫ. Этот код пока что тестировал на винде, на убунте у меня курл не установлен...