[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Написание бота-собеседника
walterb
Здравствуйте!

Есть такое предложение.

Нужно написать бота-собеседника, наподобие www.hottabych.net/kisa/
Написать надо на PHP.
Без использования бд, хранить данные в xml файле (удобном и понятном для редактирования/добавления ответов).
При этом бот должен минимально грузить сервер(не загружая в память всю базу сразу и т.д.) и шустро искать по большой базе.

Принцип ответов такой же как в у Кисы – по ключевым словам и по нарастанию настроения. То есть чтобы ответы не повторялись подряд.

И самое главное: если в конфиге стоит, к примеру, debug=1, то бот работает в обучающемся режиме, то есть, если после вопроса/фразы человека в базе не находится подходящей связки "ключевое слово-ответ", то бот спрашивает нечто вроде "А как бы ответил ты?", после чего из ответа человека выделить ключевое слово и ответ, а потом создать новую связку и добавить ее в базу (некоторая самообучаемость). Если же debug=0 – то при неизвестной связке "ключевое слово-ответ" бот должен либо говорить одну из заготовленных фраз, либо менять тему.


Если кого заинтересовало - готов обсудить цену и сроки.

P.S. Это не какой-нибудь коммерческий проект - бот будет использоваться только личных целях и мир его никогда не увидит.



Спустя 20 минут, 14 секунд (13.11.2010 - 07:57) twin написал(а):
Это
Цитата
Без использования бд, хранить данные в xml файле (удобном и понятном для редактирования/добавления ответов).

и это
Цитата
При этом бот должен минимально грузить сервер(не загружая в память всю базу сразу и т.д.) и шустро искать по большой базе.

явно нестыкуется.

Спустя 10 минут, 12 секунд (13.11.2010 - 08:07) walterb написал(а):
Цитата (twin @ 13.11.2010 - 04:57)
явно нестыкуется.

Почему же не стыкуется? Сама Киса работает тоже без базы, на xml и тоже не сильно сервер грузит.

---

Все пункты можно обсудить. Может у кого уже есть наработки - будет еще проще...

Спустя 1 час, 41 минута, 11 секунд (13.11.2010 - 09:48) Basili4 написал(а):
walterb
КИСА настольное приложение. и как так не грузит ??? еще как грузит.

Спустя 4 минуты, 49 секунд (13.11.2010 - 09:53) FatCat написал(а):
Если делать по уму, то ТОЛЬКО на базе. Никаких файлов.
И определять тему не по ключевому слову, ибо лажа, а по семантике текста. Действующий алгоритм распознавания темы тут: http://phpforum.ru/index.php?act=module&module=sema
И самообучение всегда: всё, введенное в диалогах. сохранять и использовать для пополнения семантической базы.

Спустя 33 минуты, 37 секунд (13.11.2010 - 10:27) Guest написал(а):
FatCat, возьметесь сделать так, как сказали (MySQL+семантический анализ+самообучение) ?

Спустя 49 секунд (13.11.2010 - 10:28) walterb написал(а):
FatCat, возьметесь сделать так, как сказали (MySQL+семантический анализ+самообучение) ?
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.