О Думботе 3

Думбот 3 предназначен для того чтобы продавцы товаров и услуг и покупатели могли находить друг друга с наибольшим комфортом. Любой продавец мелкий или крупный должен иметь возможность добавить информацию о своем товаре или услуге в информационную систему. Описание товаров или услуг продавец добавляет на Естественном Языке. В последующих версиях Думбот будет задавать дополнительные вопросы, чтобы уточнить информацию. В идеале такая информация будет добавляться через диалог продавца с Думботом на ЕЯ. Покупатель будет на Естественном Языке описывать качества интересующего товара, и Думбот будет находить наиболее подходящие предложения товаров или услуг. В идеале Думбот будет заменять консультанта-продавца, владеющего огромной информационной базой по теме. Важным будет объединение отдельных экземпляров Думбота в единую сеть. Должна быть возможность из одной поисковой строки посылать запрос ко всем экземплярам базы с информацией о товарах и услугах.

Концепция Думбота

Думбот – это проект по созданию программ, взаимодействующих с человеком на Естественном Языке (ЕЯ). Так же программы должны взаимодействовать между собой на ЕЯ. Развитие программ должно двигаться от простого к сложному. В последующих версиях планируется создание диалоговой системы, ведущей диалог с человеком на ЕЯ. Тематика, с которой программа работает, так же должна расширяться постепенно.

  1. На начальном этапе создается база данных, которая заполняется информацией при помощи текста на ЕЯ. Информация из БД извлекается при помощи запросов на ЕЯ. При этом используются «анкетные фразы», т.е. фразы, которые могут не быть законченными предложениями на ЕЯ так же как в анкете.
  2. На следующем этапе создается вопросно-ответная система, которая использует полноценные предложения на ЕЯ для внесения информации в БД и для извлечения информации из БД. Это уже позволит различным экземплярам программы общаться между собой на ЕЯ.
  3. Далее к вопросно-ответной системе добавляется модуль стратегии ведения диалога. После того, как программа научится запоминать информацию на ЕЯ и отвечать на вопросы на ЕЯ, программа будет учиться соединять фразы между собой в один связный диалог.
  4. На заключительном этапе программе нужно приобрести здравый смысл, научиться анализировать информацию и делать выводы. Для этого нужно добавить Модели Поведения. Еще рано объяснять, что это такое.

При разработке технологии для данного проекта были рассмотрены варианты использования различных технологий. Нужно отметить, что были разработаны, а затем отвергнуты варианты использования графовых технологий и анализа грамматики текста без анализа смысла. Основной принцип можно коротко сформулировать так. Нужно соединять друг с другом различные модели представления и обработки данных. Для каждого конкретного случая нужно создавать свои модели представления и обработки данных. Одна технология типа семантических сетей или онтологий не подходит для наших целей. Разработанная технология позволяет создать компактный и высоко эффективный программный код.

Для быстрой работы систем обработки текстов ЕЯ могут быть созданы новые программные и аппаратные средства. Скорее всего это будут не нейронные сети и не компьютеры со стандартной архитектурой.

Концепция понимания смысла текста на Естественном Языке (ЕЯ)

Информация – это отражение реальности в виде знаков или следа.

Рассмотрим частный случай этого определения:

Информация – это отражение окружающего мира в виде знаков.

Слова в тексте на ЕЯ являются знаками, обозначающими предметы, действия, свойства предметов из окружающего мира. Соединения слов обозначают действия, происходящие с предметами, принадлежность свойств предметам и т.д. Смысл текста – это та информация, которая содержится в тексте и обозначается знаками в виде соединения слов.

Понимание смысла текста системой – это перевод информации из текста во внутреннее представление в системе. При этом внутренне представление информации в системе обеспечивает адекватную реакцию системы на эту информацию.

В случае понимания текста адекватной реакцией системы могут быть ответы на вопросы к тексту. Можно говорить о понимании текста системой только тогда, когда сложность текста и вопросов к тексту достигает определенного уровня. Так же понимание текста можно связать с необходимостью делать выводы из информации, содержащейся в тексте, и с необходимостью иметь дополнительную информацию по теме текста.

Безусловно, будущее Информационных Технологий заключается в понимании текстов на ЕЯ и взаимодействии человека с компьютером на ЕЯ.

При разработке компьютерных программ для понимания текста сложность текста и уровень понимания должны развиваться постепенно от простого к сложному.

Думбот реализует описанные принципы.

В случае Думбота 3 в тексте на ЕЯ описываются характеристики товаров, условия продажи товаров и т.д. Думбот 3 преобразует эту информацию с ЕЯ во внутреннее представление. Затем можно делать запрос Думботу на ЕЯ по характеристикам товара и Думбот подберет предложения товаров, имеющих соответствующие характеристики. Текст на ЕЯ имеет достаточный уровень сложности. Поэтому можно говорить о том, что Думбот 3 понимает текст на ЕЯ. Думбот 3 использует не полноценные предложения на ЕЯ, а «анкетные фразы». Если мы заполняем анкету, мы тоже не используем полноценные предложения на ЕЯ, но мы говорим, что анкета заполняется на ЕЯ. Так же если ребенок использует только простые фразы и не строит полные правильные предложения, мы все равно говорим, что ребенок понимает.

 

free-templates.ru