Есть новостной сайт , в нем нужные новости)
Но беда в том , что админы видимо были веселыми))
пройдясь регулярками все вырезается на ура и как надо, но ! В некоторых местах есть текст заключенный в <>, то есть что то вроде <ООО РОГА И КОПЫТА>, и при очистке тэгов с помощью
strip_tags, она естественно вырезается, так как напоминает тег))
Вот вопрос , как можно это обойти?
Например какую регулярку посоветуете, чтоб проверка была:
<если тут русский язык>то <> заменить на пробелы и текст оставить.. Заранее благодарен..а то уже мозга кипит..по разному пробовал.. то вообще везде теги вырезат, то вообще нигде))
Спустя 16 минут, 41 секунда (4.06.2012 - 09:28) TMake написал(а):
<[^А-Яа-я]*>
Спустя 4 минуты, 36 секунд (4.06.2012 - 09:32) TMake написал(а):
Спустя 2 минуты, 55 секунд (4.06.2012 - 09:35) evdonik написал(а):
Спасибо) принцип какой, автоматом получаются ссылки и обрабатываются.
Хм..подвис..
$pattern=' /(<[^А-Яа-я]*>|<.*"[а-я]*">)/g'
preg_match_all($pattern, $page, $reslist);
$text = $reslist[0];
//print_r($text);
$text = convert_codepage($codepage,$text);
Хм..подвис..
Спустя 1 минута, 40 секунд (4.06.2012 - 09:37) evdonik написал(а):
strip_tagsуже не надо получается??
Спустя 45 минут, 38 секунд (4.06.2012 - 10:22) evdonik написал(а):
А не подскажете как просто организовать замену?)
< на пробел и > на пробел.
То есть Найдено что <Текст> не тег и < > заменить нафиг.
< на пробел и > на пробел.
То есть Найдено что <Текст> не тег и < > заменить нафиг.
Спустя 4 минуты, 23 секунды (4.06.2012 - 10:27) TMake написал(а):
Спустя 3 часа, 30 минут, 37 секунд (4.06.2012 - 13:57) vagrand написал(а):
Вообще то в таких случаях надо использовать не strip_tags или какие-то регекспы, а htmlspecialchars()
Спустя 1 час, 5 секунд (4.06.2012 - 14:57) evdonik написал(а):
Решил с помощью сторонней системы
strip_tags_smart
Всем спасибо за помощь))
strip_tags_smart
Всем спасибо за помощь))