Форум PHP программистов > Не работает регулярка

[ Поиск ] - [ Пользователи ] - [ Календарь ]

LonRv

11.08.2011 - 17:28

Бодрого дня, уважаемые.

Делаю себе на сайт поиск по торрент-трекерам, который по сути парсит результаты bitsnoop.com. Возникла проблема при обработке результа - примитивнейшая регулярка не хочет работать. До этого я уже писал парс "интересных фактов" с википедии, подобных проблем небыло.

Код:

$up_result = file_get_contents ("http://bitsnoop.com/search/" . $in . "/" . $query . "/");

preg_match_all ("/<li>(.*)<\/li>/U", $up_result, $values);

echo ($values[1][0]);

Да, я проверил - в up_result лежит код нужной мне страницы, и содержание тега title извлекается нормально.

Добавлю также, что когда битснуп не находит торренты по запросу, и предлагает список возможных причин, оформленных в теги li, то регулярка их хорошо видит.
Либо я плохо понимаю суть жизни либо здесь не обошлось без вмешательства астральных существ.

Прошу помочь, буду крайне благодарен!

Спустя 2 часа, 18 минут, 37 секунд (11.08.2011 - 18:47) jetistyum написал(а):

1. рекоммендую посмотреть на библиотеку
http://simplehtmldom.sourceforge.net/

2. ну и выложить желательно страничку (не сюда лучше, а на pastebin.com) для того чтобы можно было найти ошибку.

проблем может быть сколько угодно много, от пробела внутри тега, либо id либо класса, либо еще чего-то... до не возможности получить нужную страницу.

Спустя 13 минут, 44 секунды (11.08.2011 - 19:01) LonRv написал(а):

http://pastebin.com/S1HScYCQ

собсно ^^

Спустя 9 минут, 53 секунды (11.08.2011 - 19:11) jetistyum написал(а):

ты это откуда взял? из браузера или именно после получения из file_get_contents?

Спустя 13 минут, 51 секунда (11.08.2011 - 19:24) jetistyum написал(а):

$values = array();
preg_match_all ("|<li>(.+)<\/li>|is", $string, $values);
var_dump($values);

Спустя 16 часов, 19 минут, 40 секунд (12.08.2011 - 11:44) LonRv написал(а):

спасибо большое)

Быстрый ответ:

Здесь расположена полная версия этой страницы.