[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Не могу подобрать паттерн
Игорь_Vasinsky
Вообщем есть страница с талицей, которую я парсю :D

Использую

"#(<table width=\"100%\" border=\"0\" class=\"content_table\">(.*)</script></div>)#iusU"


На этой странице есть таблица с "деревом"

http://www.xxx.ru/catalogs/index.html?b...dl=36&mdf=22441

После этой таблицы есть JS


Странно но есть аналогичная страница

http://www.xxx.ru/catalogs/index.html?b...=4403&mdf=13535

На котрой мой паттерн работает/

Кому не лень гляньте - может можно оптимальней подобрать...

SDH не нужно предлогать, весь парсер уже написан на регулярках, тока в нескольких разделах такая не состыковка.



Спустя 1 час, 18 минут, 55 секунд (8.10.2011 - 14:39) Игорь_Vasinsky написал(а):
очень мана надо...

Спустя 1 час, 44 минуты, 24 секунды (8.10.2011 - 16:24) jetistyum написал(а):
preg_match ("#(<table width=\"100%\" border=\"0\" class=\"content_table\">(.+)</script></div>)#s", $string, $values);

Спустя 50 секунд (8.10.2011 - 16:24) jetistyum написал(а):
почему не работает с модификатором U не знаю sad.gif вроде тут нет другого варианта - с жадным/не жадным вхождением

Спустя 1 минута, 46 секунд (8.10.2011 - 16:26) Игорь_Vasinsky написал(а):
Вообщем может кому просто лень, выложу код
    $url = "http://www.xxx.ru/catalogs/index.html?b...=4403&mdf=13535"
#Получить контент страницы
$ch = curl_init (); // инициализация
curl_setopt ($ch , CURLOPT_URL , $url);
curl_setopt ($ch , CURLOPT_USERAGENT , "Mozilla/5.0"); // каким браузером будем прикидываться
curl_setopt ($ch , CURLOPT_RETURNTRANSFER , 1 ); // вывод страницы в переменную
$content = curl_exec($ch); // скачиваем страницу
curl_close($ch); // закрываем соединение

$pattern = "#(<table width=\"100%\" border=\"0\" class=\"content_table\">(.*)</script></div>)#iusU";
preg_match_all($pattern, $content, $html);

echo '<pre>' .print_r($html, 1). '</pre>';


этот код вернёт "набитый" массив

а вот с идентичной ссылкой
http://www.xxx.ru/catalogs/index.html?b...dl=36&mdf=22441

массив не забивается <_<

Спустя 6 минут, 36 секунд (8.10.2011 - 16:33) Игорь_Vasinsky написал(а):
jetistyum
тебе громаДнОеЕеЕ спасибо!

Спустя 4 минуты, 28 секунд (8.10.2011 - 16:37) jetistyum написал(а):
Всегда рад, люблю поковырять регулярки smile.gif когда есть немного времени.


_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.