[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Фильтр нецензурной брани
works_users
Нужен мощный фильтр нецензурной брани, кто что подскажет?
forza
<?php
function
cropBadWords($string) {
$bad = array('bird', 'cow', 'milk', 'world');
foreach ($bad as $w)
$string = preg_replace ("~$w~i", " ", $string);
return $string;
}

$string = "Hello world";
echo cropBadWords($string);


_____________
Заработок для веб-разработчиков: CodeCanyon
Мое Портфолио
works_users
это слишком просто
forza
Зная русский менталитет, могу со 100% уверенностью сказать, что хрен напишешь такой фильтр. Русский язык - богатый. Это у англиков можно вырезать f**k, b***h, a** и спать спокойно smile.gif

_____________
Заработок для веб-разработчиков: CodeCanyon
Мое Портфолио
works_users
это верно, всё что я нашёл в нете - это примеры удаляющие примитивные маты, а есть какой нибудь специальный сервис по фильтру матов
kristall
Лучше сделать кнопку "Пожаловаться на мат". Пускай юзеры сами матюги друг за другом распознают.

_____________
echo '<pre>',print_r($var, 1);die;

root@server# make love && war
works_users
не это не пойдёт
DedMorozzz
Сабж не осуществим.
Вариантов уйма. Если ты в мате заменишь б на 6, уже не пройдёт, или о на 0, или ... вариантов обхода, слишком много и в конечном итоге всё равно не даст результата.
Пример сайт близов, там есть антимат, и в итоге даже посты от администрации получаются абсурдными. Когда в нормальном слове "содержится" мат.
К примеру слово "лохмотья". Если заменять маты, то получится "%$#@мотья"
И проблем больше чем найти иное решение, чем замена матов.
Ибо тут ещё надо учесть и безграмотность юзеров. Слово "дебил", в качестве оскорбления(тоже ненадо же пропускать) могут написать как "дибил". И на примере этого же слова, то что может быть оскорблением, может является и литературным
Т.о. старайся найти другое решение

_____________
Если не говорить пользователям, что Linux это "Сложно и страшно", то им совершенно всё равно, в чём не разбираться
ilyaplot
У sphinx хороший языковой движок. Можно с помощью него фильтровать. Так же можно обучать антимат, выделяя слова, которые будут склоняться при поиске. Вот вам не слишком просто smile.gif

_____________
Заработай на Userator
AlmazDelDiablo
Слишком просто? Напишите нейронную сеть и обучите её выискивать мат не по тупому сравнению символов, а то тематике сообщения, эмоциям отправителя, контексту поста и т.д.

_____________
Блог | VK | GitHub | Twitch
DedMorozzz
Цитата
Так же можно обучать антимат, выделяя слова, которые будут склоняться при поиске.
ага, а сколько времени будет занимать фильтрация, по огромному словарю текста в 2000 символов?

_____________
Если не говорить пользователям, что Linux это "Сложно и страшно", то им совершенно всё равно, в чём не разбираться
inpost
Почитайте работы Бляхера. Может иначе будете смотреть на жизнь smile.gif

_____________
Обучаю веб-программированию качественно и не дорого: http://school-php.com
Фрилансер, принимаю заказы: PHP, JS, AS (видео-чаты). Писать в ЛС (Личные сообщения на phpforum).
Visman
Censure: определение наличия мата (нецензурных слов) в тексте, матотест
http://forum.dklab.ru/viewtopic.php?t=26137
philya
Может вы не заметили, но многие крупные сайты(так все вроде) отказались от этой идеи(наверное, бесполезно). Все русские говорят матом, от этого никуда не денешься
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2025 Invision Power Services, Inc.