Общий смысл можно сформировать так: существуют слова, для которых регулярка вполне подойдет. Для этого нужно, чтоб корень содержал не менее (это предположение) 5-ти символов и не изменялся. Под это правило подходит "сосед". Однако поиск однокоренных в одном тексте - это задача так себе по сложности. Получается все целые куски из 5ти символов нужно сравнивать со всем остальным текстом.
Если глобально решать задачу, то специальные словари - будет менее ресурсозатратным решением по выходному результату, но х.з. как по времезатратам на реализацию.
_____________
Youtube канал WebDeveloper->Run()Сайт для душиGitter