Здраствуйте, делаю парселку текста, заголовок парсит, а сам текст нет, видимо из-за того что в тексте содержатся теги <p>,<br> и др
вот код
PHP |
$file3 = file_get_contents($aaa); $file1 = preg_match_all('|<td class="news_header">(.+)</td>|',$file3,$frazes1); $file2 = preg_match_all('|<td class="news_text">(.+)</td>|',$file3,$frazes2);
for($j=0;$j<1;$j++){ $tit[$i] .= $frazes1[1][$j]; $text[$i] .= $frazes2[1][$j]; } echo $tit[$i]; echo $text[$i]; } |
$file2 = preg_match_all('|<td class="news_text">(.+)</td>|',$file3,$frazes2); =
это не парсит.
текст находится между тегами <td class="news_text"> и </td>
пробовал, поразному менять ничего у меня не вышло. ПОмогите пожалуйста разобратся.
Спустя 23 минуты, 55 секунд (26.03.2009 - 18:06) olgatcpip написал(а):
попробуй вот так
PHP |
$file2 = preg_match_all('|<td class="news_text">(.+)</td>|U',$file3,$frazes2); |
Не знаю что означает U, но я всегда с ней делаю.
Спустя 15 минут, 59 секунд (26.03.2009 - 18:22) z3rg написал(а):
olgatcpip, спасибо, но я так уже пробовал, не хочет.
а U - эт типа модификатор шаблона я так понял
вот тута написано про них _http://www.pcre.ru/docs/php/text/stdmod/
Спустя 39 минут, 41 секунда (26.03.2009 - 19:02) z3rg написал(а):
все, мне подсказали, надо было так
$file2 = preg_match_all('|<td class="news_text">(.*)</td>|s',$file2,$frazes2);
Спустя 1 час, 25 минут, 1 секунда (26.03.2009 - 20:27) twin написал(а):
Цитата |
Не знаю что означает U, но я всегда с ней делаю. |
это модификатор для кирилицы в utf. Без него с кирилицей будут проблемы.