[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Не работает регулярка
LonRv
Бодрого дня, уважаемые.

Делаю себе на сайт поиск по торрент-трекерам, который по сути парсит результаты bitsnoop.com. Возникла проблема при обработке результа - примитивнейшая регулярка не хочет работать. До этого я уже писал парс "интересных фактов" с википедии, подобных проблем небыло.

Код:

$up_result = file_get_contents ("http://bitsnoop.com/search/" . $in . "/" . $query . "/");

preg_match_all ("/<li>(.*)<\/li>/U", $up_result, $values);

echo ($values[1][0]);


Да, я проверил - в up_result лежит код нужной мне страницы, и содержание тега title извлекается нормально.

Добавлю также, что когда битснуп не находит торренты по запросу, и предлагает список возможных причин, оформленных в теги li, то регулярка их хорошо видит.
Либо я плохо понимаю суть жизни либо здесь не обошлось без вмешательства астральных существ.

Прошу помочь, буду крайне благодарен!



Спустя 2 часа, 18 минут, 37 секунд (11.08.2011 - 18:47) jetistyum написал(а):
1. рекоммендую посмотреть на библиотеку
http://simplehtmldom.sourceforge.net/

2. ну и выложить желательно страничку (не сюда лучше, а на pastebin.com) для того чтобы можно было найти ошибку.

проблем может быть сколько угодно много, от пробела внутри тега, либо id либо класса, либо еще чего-то... до не возможности получить нужную страницу.

Спустя 13 минут, 44 секунды (11.08.2011 - 19:01) LonRv написал(а):

Спустя 9 минут, 53 секунды (11.08.2011 - 19:11) jetistyum написал(а):
ты это откуда взял? из браузера или именно после получения из file_get_contents?

Спустя 13 минут, 51 секунда (11.08.2011 - 19:24) jetistyum написал(а):
$values = array();
preg_match_all ("|<li>(.+)<\/li>|is", $string, $values);
var_dump($values);

Спустя 16 часов, 19 минут, 40 секунд (12.08.2011 - 11:44) LonRv написал(а):
спасибо большое)
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.