Форум PHP программистов > Не работает регулярка

[ Поиск ] - [ Пользователи ] - [ Календарь ]

z3rg

26.03.2009 - 18:42

Здраствуйте, делаю парселку текста, заголовок парсит, а сам текст нет, видимо из-за того что в тексте содержатся теги <p>,<br> и др

вот код

PHP

$file3 = file_get_contents($aaa); 
$file1 = preg_match_all('|<td class="news_header">(.+)</td>|',$file3,$frazes1); 
$file2 = preg_match_all('|<td class="news_text">(.+)</td>|',$file3,$frazes2); 

 for($j=0;$j<1;$j++){ 
$tit[$i] .= $frazes1[1][$j];
$text[$i] .= $frazes2[1][$j];
} 
echo $tit[$i];
echo $text[$i];
}

$file2 = preg_match_all('|<td class="news_text">(.+)</td>|',$file3,$frazes2); =
это не парсит.
текст находится между тегами <td class="news_text"> и </td>
пробовал, поразному менять ничего у меня не вышло. ПОмогите пожалуйста разобратся.

Спустя 23 минуты, 55 секунд (26.03.2009 - 18:06) olgatcpip написал(а):

попробуй вот так

PHP

$file2 = preg_match_all('|<td class="news_text">(.+)</td>|U',$file3,$frazes2);

Не знаю что означает U, но я всегда с ней делаю.

Спустя 15 минут, 59 секунд (26.03.2009 - 18:22) z3rg написал(а):

olgatcpip, спасибо, но я так уже пробовал, не хочет.
а U - эт типа модификатор шаблона я так понял
вот тута написано про них _http://www.pcre.ru/docs/php/text/stdmod/

Спустя 39 минут, 41 секунда (26.03.2009 - 19:02) z3rg написал(а):

все, мне подсказали, надо было так
$file2 = preg_match_all('|<td class="news_text">(.*)</td>|s',$file2,$frazes2);

Спустя 1 час, 25 минут, 1 секунда (26.03.2009 - 20:27) twin написал(а):

Цитата

Не знаю что означает U, но я всегда с ней делаю.

это модификатор для кирилицы в utf. Без него с кирилицей будут проблемы.

Быстрый ответ:

Здесь расположена полная версия этой страницы.