Использую
"#(<table width=\"100%\" border=\"0\" class=\"content_table\">(.*)</script></div>)#iusU"
На этой странице есть таблица с "деревом"
http://www.xxx.ru/catalogs/index.html?b...dl=36&mdf=22441
После этой таблицы есть JS
Странно но есть аналогичная страница
http://www.xxx.ru/catalogs/index.html?b...=4403&mdf=13535
На котрой мой паттерн работает/
Кому не лень гляньте - может можно оптимальней подобрать...
SDH не нужно предлогать, весь парсер уже написан на регулярках, тока в нескольких разделах такая не состыковка.
Спустя 1 час, 18 минут, 55 секунд (8.10.2011 - 14:39) Игорь_Vasinsky написал(а):
очень мана надо...
Спустя 1 час, 44 минуты, 24 секунды (8.10.2011 - 16:24) jetistyum написал(а):
preg_match ("#(<table width=\"100%\" border=\"0\" class=\"content_table\">(.+)</script></div>)#s", $string, $values);
Спустя 50 секунд (8.10.2011 - 16:24) jetistyum написал(а):
почему не работает с модификатором U не знаю вроде тут нет другого варианта - с жадным/не жадным вхождением
Спустя 1 минута, 46 секунд (8.10.2011 - 16:26) Игорь_Vasinsky написал(а):
Вообщем может кому просто лень, выложу код
этот код вернёт "набитый" массив
а вот с идентичной ссылкой
http://www.xxx.ru/catalogs/index.html?b...dl=36&mdf=22441
массив не забивается <_<
$url = "http://www.xxx.ru/catalogs/index.html?b...=4403&mdf=13535"
#Получить контент страницы
$ch = curl_init (); // инициализация
curl_setopt ($ch , CURLOPT_URL , $url);
curl_setopt ($ch , CURLOPT_USERAGENT , "Mozilla/5.0"); // каким браузером будем прикидываться
curl_setopt ($ch , CURLOPT_RETURNTRANSFER , 1 ); // вывод страницы в переменную
$content = curl_exec($ch); // скачиваем страницу
curl_close($ch); // закрываем соединение
$pattern = "#(<table width=\"100%\" border=\"0\" class=\"content_table\">(.*)</script></div>)#iusU";
preg_match_all($pattern, $content, $html);
echo '<pre>' .print_r($html, 1). '</pre>';
этот код вернёт "набитый" массив
а вот с идентичной ссылкой
http://www.xxx.ru/catalogs/index.html?b...dl=36&mdf=22441
массив не забивается <_<
Спустя 6 минут, 36 секунд (8.10.2011 - 16:33) Игорь_Vasinsky написал(а):
jetistyum
тебе громаДнОеЕеЕ спасибо!
тебе громаДнОеЕеЕ спасибо!
Спустя 4 минуты, 28 секунд (8.10.2011 - 16:37) jetistyum написал(а):
Всегда рад, люблю поковырять регулярки когда есть немного времени.
_____________
HTML, CSS (Bootstrap), JS(JQuery, ExtJS), PHP, MySQL, MSSql, Posgres, (TSql, BI OLAP, MDX), Mongo, Git, SVN, CodeIgnater, Symfony, Yii 2, JiRA, Redmine, Bitbucket, Composer, Rabbit MQ, Amazon (SQS, S3, Transcribe), Docker