[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: парсить сайт
артем23
Всем привет!

Есть сайт, из которого я пытаюсь вытащить текст, в коде я его выделил жирным, - чего то в регулярках я не знаю)

<div class="topicbox"><a name="3"></a><h1 class="title"><a href="">06 
июля 2010</a></h1><div class="text">Начало жно...</div> <table border="0" class="votingbox"><tbody><tr valign="top">
<td><b>
1</b></td>
<td><table
class="voting"><tbody><tr>
<td><input
type="radio" value="-2" name="ids[458035]"><br>-2</td>
<td><input
type="radio" value="-1" name="ids[458035]"><br>-1</td>

<td
class="rate">681<br>1.54</td>
</tr></tbody></table></td>
<td
id="msg_post_458035" style="padding-top: 5px;">
</div>

<div
class="topicbox">
и тоже самое
</div>


на странице это выглядит вот так:
"Начало жно...

и тоже самое
"

и ругуярка неработает
 !<pre>(.*?)</pre>!si




Спустя 1 час, 2 минуты, 25 секунд (9.07.2010 - 09:35) ApuktaChehov написал(а):
А причем тут <pre></pre>?

Спустя 3 минуты, 21 секунда (9.07.2010 - 09:39) DedMorozzz написал(а):
#<div class=\".*?\">(.*?)</div>#s

Спустя 48 секунд (9.07.2010 - 09:39) Gradus написал(а):
не знаете регулярки ? используйте strpos и его братьев

Спустя 2 минуты, 58 секунд (9.07.2010 - 09:42) артем23 написал(а):
А причем тут <pre></pre>? да вот сам не знаю)) код не мой),

наверно нужно было вопрос задать, а что, бывают случаи когда верстку через <pre> верстают)?

Не знаете регулярки - научись))

Спустя 19 минут, 9 секунд (9.07.2010 - 10:02) ApuktaChehov написал(а):
DedMorozzz твоя выражение еще и <a href="">06
июля 2010</a> хватает.

Я тут наковырял. Как всегда через одно место, но работает, вроде wink.gif
/<div[^<]*>([^<])+<\/div>/ius

Спустя 12 минут, 40 секунд (9.07.2010 - 10:14) DedMorozzz написал(а):
Ага, не заметил, что оно тож условию удовлетворяет. Ща исправлю)
#<div class=\".*?\">([A-zА-яё0-9\"\. \-]+?)</div>#sui
как-то так. Если искомое только текст, с точками и кавычками, пробелами и тире. Всё что ещё понадобится, просто подставить. А там уже лепи что хочешь smile.gif
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2025 Invision Power Services, Inc.