Кто нибудь выцеплял теги из текста?
Нет проблем найти часто встречаемые слова в тексте, нет проблем выбрать только существительные, нет проблем привести слова к одной форме типа "На выставке самолётов" => [Выставка, Самолёт]
Всё это легко делает MyStem от яндекса.
Но как быть с парными словами? "Владимир Путин посетил выставку" => [Владимир Путин, Выставка]
Есть идея сначала как то набить базу правильных тегов, потом по слову "Путин" найти подходящий тег [Владимир Путин] и его использовать, но могут быть ошибки типа "Город Владимир" или "Владимир Невский" или [Президент России] [Президент Украины]
Есть идеи?
_____________
Промокод предоставляет скидку на заказ домена и/или хостинга reg.ru
BFCC-3895-8804-9ED2