Делаю себе на сайт поиск по торрент-трекерам, который по сути парсит результаты bitsnoop.com. Возникла проблема при обработке результа - примитивнейшая регулярка не хочет работать. До этого я уже писал парс "интересных фактов" с википедии, подобных проблем небыло.
Код:
$up_result = file_get_contents ("http://bitsnoop.com/search/" . $in . "/" . $query . "/");
preg_match_all ("/<li>(.*)<\/li>/U", $up_result, $values);
echo ($values[1][0]);
Да, я проверил - в up_result лежит код нужной мне страницы, и содержание тега title извлекается нормально.
Добавлю также, что когда битснуп не находит торренты по запросу, и предлагает список возможных причин, оформленных в теги li, то регулярка их хорошо видит.
Либо я плохо понимаю суть жизни либо здесь не обошлось без вмешательства астральных существ.
Прошу помочь, буду крайне благодарен!
Спустя 2 часа, 18 минут, 37 секунд (11.08.2011 - 18:47) jetistyum написал(а):
1. рекоммендую посмотреть на библиотеку
http://simplehtmldom.sourceforge.net/
2. ну и выложить желательно страничку (не сюда лучше, а на pastebin.com) для того чтобы можно было найти ошибку.
проблем может быть сколько угодно много, от пробела внутри тега, либо id либо класса, либо еще чего-то... до не возможности получить нужную страницу.
http://simplehtmldom.sourceforge.net/
2. ну и выложить желательно страничку (не сюда лучше, а на pastebin.com) для того чтобы можно было найти ошибку.
проблем может быть сколько угодно много, от пробела внутри тега, либо id либо класса, либо еще чего-то... до не возможности получить нужную страницу.
Спустя 13 минут, 44 секунды (11.08.2011 - 19:01) LonRv написал(а):
Спустя 9 минут, 53 секунды (11.08.2011 - 19:11) jetistyum написал(а):
ты это откуда взял? из браузера или именно после получения из file_get_contents?
Спустя 13 минут, 51 секунда (11.08.2011 - 19:24) jetistyum написал(а):
$values = array();
preg_match_all ("|<li>(.+)<\/li>|is", $string, $values);
var_dump($values);
Спустя 16 часов, 19 минут, 40 секунд (12.08.2011 - 11:44) LonRv написал(а):
спасибо большое)