[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: простой парсер
MadMike
Пытаюсь написать простой парсер. Должен тянуть новости.
Новости в коде сайта донора идут в таком виде:
<div class="item">Новость 1</div>
<div
class="item">Новость 2</div>
<div
class="item">Новость 3</div>

Помогите понять почему не работает. Все перепроверил - вроде верно.
$contentnews = file_get_contents('http://gazeta.a42.ru/lenta/tags/tayga');

preg_match_all('#<div class="item">(.*)</div>#',$contentnews,$arraynews);

for ($i=0; $i< count($arraynews[0]); $i++) {
echo "Новость: " . $arraynews[0][$i] . "\n";
}


_____________
Мы не знаем что это такое, если бы мы знали что это такое, мы не знаем что это такое!
SDV

preg_match_all('#<div class="item">([^<>]+)</div>#',$contentnews,$arraynews);

может так получится?
MadMike
увы но нет

_____________
Мы не знаем что это такое, если бы мы знали что это такое, мы не знаем что это такое!
linker
preg_match_all('#<div class="item">(.*?)</div>#',$contentnews,$arraynews);
print_r($arraynews[1]);


_____________
Gear Framework
Gear Framework на Github
MadMike
Вот так сработало. Спасибо за помощь
$w = preg_match_all("/class=\"item\"(.*?)<\/div>/s",$contentnews,$arraynews);

for ($i=0; $i< count($arraynews[0]); $i++) {
echo "Новость: " . str_replace("class=\"item\"","",$arraynews[0][$i]) . "\n";
}


_____________
Мы не знаем что это такое, если бы мы знали что это такое, мы не знаем что это такое!
paul85
почему не DOMDocument? Он разве не для этого? =)
linker
Я думаю он тут излишен.

_____________
Gear Framework
Gear Framework на Github
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.