Всем доброго времени суток.
Подскажите решения проблемы.
Есть сайт, на нем есть новости с заголовками:
"создать тему на форуме"
"создать тему на форумах"
"создать тему на форуме тут"
"создать тему на форуме там"
"создать пост где-то тут"
и тд.
Смысл таков, хочу группировать все подобные темы, что бы не было срача в ленте новостей и что бы при прочтении новости, выдавались однотипные.
В бд ~ 100 000 новостей и их число стремительно растет.
Вопрос, как сделать условие, что если новость отличается от исходной меньше, чем на 10%, значит она подобная.