[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Html parser
BobrDobr94
Привет всем! народ подскажите как сделать: есть страница http://site.ru/page1.html
, знаем что на странице есть некий кусок текста к примеру : Привет мир! Это я... , но мы не знаем весь текст а лишь кусочек: Привет мир! нужно что бы скрипт определил где текст расположен <div></div> или <h2></h2> и т.д. и спарсил его...
ну вот в принципе и всё)



Спустя 3 минуты, 35 секунд (11.03.2010 - 20:08) qpayct написал(а):
1. берёшь страницу.
2. ищешь начало.
3. ищешь конец
4. вырезаешь всё что между началом и концом.

а на какой стадии ты?

Спустя 15 минут, 16 секунд (11.03.2010 - 20:23) BobrDobr94 написал(а):
я на стадии когда программа просто парсит rss анонс, а нуна сделать что бы весь тянуло...
@qpayct можно что то более пшпэшное smile.gif(код что бы было чучуть понятнее) я просто не очень силён в php, новичок...

Спустя 28 минут, 31 секунда (11.03.2010 - 20:52) qpayct написал(а):
в таком случае тебе надо начинать с первого пункта

Спустя 13 часов, 1 минута, 31 секунда (12.03.2010 - 09:53) Mozzi написал(а):
Берёшь регексп, и забываешь о слове "парсить".

Спустя 6 часов, 27 минут, 1 секунда (12.03.2010 - 16:20) BobrDobr94 написал(а):
хорошо вот есть

$text = '<p>Привет мир! это я...</p>';
preg_match('/<p>Привет мир! (.|\s)*?<\/p>/', $text, $matches);
var_dump($matches[0]);

а если я не знаю в каком теге находится текст то как составить регулярку не подскажите???

Спустя 29 минут, 57 секунд (12.03.2010 - 16:50) Mozzi написал(а):
На вскидку, самый простой вариант если уверены что в тексте который вы выделяете нет других тегов:
$text = '<p>Привет мир! это я...</p>';
preg_match('/>(.*?Привет мир!.*?)<\//', $text, $matches);
var_dump($matches[1]);


Спустя 9 минут, 41 секунда (12.03.2010 - 17:00) netruxa написал(а):
$text = '<p>Привет мир! это я...</p><h1>teg h1</h1><h2>teg h2</h2>';
preg_match_all('/<(.*?)>(.*?)<\/(.*?)>/', $text, $matches);
for ($i=0; $i<=count($matches[1])-1;$i++)
{
echo '<'.$matches[1][$i].'>'.$matches[2][$i].'</'.$matches[3][$i].'>';
}

Спустя 1 час, 12 минут, 56 секунд (12.03.2010 - 18:13) BobrDobr94 написал(а):
ребят вы меня может не поняли или я не понятно выразился, вот что нуна
я знаю что на странице http://site.ru есть текст но я его, а знаю лишь кусочек, мне нужно его найти этот текст, но я не знаю между какими тегами он расположен. найти и спарсить вот)
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.