Автоматическое порождение фраз естественного языка по OWL-модели, семантике и прагматике Полина Сазонова Новосибирский Государственный Университет, Новосибирск, Россия psazonova@gmail.com Аннотация Статья посвящена решению проблемы согласования поль- зовательской и программной онтологии. В ходе работы отработаны алгоритмы порождения фраз естественного языка по OWL-модели, семантике и прагматие. Данное решение можно использовать для повышения эффективности общения пользователей с виртуальными консультантами на сайтах, специализирующихся на продаже товаров и услуг. Ключевые слова: онтология, OWL, virtual assistant, прагматика, семантика, NLP. 1 Введение В настоящее время стремительно растет количество задач, связанных с обработкой данных, решаемых с помощью онтологий. Онтологии использу- ются в теоретических исследованиях и практических разработках. По опре- делению, формальная онтология предметной области представляет собой пару , где σ - это множество ключевых понятий, а S - множество ана- литических предложений, описывающих смысл данных ключевых понятий [1]. Предложение называется аналитическим, если его значение истинности зависит только от смысла понятий, содержащихся в этом утверждении [2][3]. Онтологии применяются для построения интеллектуальных и эксперт- ных систем. В настоящее время среди компаний, реализующих свои товары через Интеренет, стало популярным использование виртуальных помощни- ков (virtual assistant). Их задачей является консультирование клиентов по вопросам, связанных с продаваемыми товарами, оказание помощи в выборе продукта, а в некоторых случаях и поддержание разговора на общие темы. Виртуальный помощник ежедневно общается с разными людьми. Каж- дый потребитель (точнее, группа потребителей) имеют свое представление о предметной области и часто используют свою специфичную лексику. Пой- мут ли друг друга клиент и виртуальный помощник? Что следует делать, чтобы достигать наибольшего понимания? Здесь мы имеем проблему согла- сования программной и пользовательской онтологий [4]. В данной работе решается задача согласования этих двух онтологий для случая общения клиента и виртуального помощника. 192 Было установлено, что для решения обозначенной проблемы, необходи- мо найти "правила соответствия"между понятиями онтологии программной системы и онтологии пользовательских задач [4]. То есть виртуальному по- мощнику необходимо говорить на языке пользователя, а именно, осуществ- лять перевод информации с онтологии программной системы на онтологию конкретного пользователя (групп пользователей). Сходным решением является технология, применяемая в чат-ботах (робот- собеседник), которая называется отзеркаливанием. Она заключается в пе- рефразировании тех выражений, которые употребляет пользователь. Чат- бот отвечает на фразу собеседника подобной фразой, несколько измененной в соответствии с контекстом диалога. Таким образом, у пользователя со- здается ощущение, что его собеседник мыслит и ощущает так же, как он сам, что создает эмпатию. Однако, употребление только перефразирован- ных выражений не может нести новую информацию. А в процессе диало- га с виртуальным собеседником пользователю должна быть предоставлена новая информация, которая могла бы сподвигнуть его к совершению дей- ствий, например, покупке чего-либо. Причем новая информация должна быть представлена в том же стиле и при помощи такой же лексики, кото- рую употребляет пользователь. 2 Разработка программной системы, осуществляющей порождение фразы естественного языка по модели, написанной на языке OWL Решение проблемы согласования онтологий заключается в разработке такого виртуального помощника, который сможет использовать "правила соответствия"между понятиями онтологии программной системы и онтоло- гии пользовательских задач. Такая программная система порождает фразы естественного языка в полуавтоматическом режиме на основе семантики и прагматики. Понятие прагматики определяется с использованием подхода Фреге [5], где прагма- тика - это соответствие между синтаксисом и семантикой. В соответствии с этим подходом одна и та же семантика может выражаться при помощи разного синтаксиса. Вид используемого синтаксиса для заданной семанти- ки зависит от пользователя, с которым происходит общение. Например, при общении с пожилыми людьми и с подростками семантически одинаковое выражение будет иметь различное синтаксическое воплощение. В данной работе семантика для порождения фразы задается OWL-моделью. Прагматика задается следующим образом. Мы делим пользователей на группы по половому признаку, возрастным категориям (молодежь, взрос- лый и пожилой) и по роду деятельности. Для каждой группы пользовате- лей лексика задается при помощи онтологии, соответствующей именно этой группе, и словаря сленговых выражений, характерных для их профессио- нальной деятельности. При порождении фразы учитывается тип пользова- теля, тем самым создается контекст общения, комфортный для пользова- 193 теля. Это происходит за счет того, что лексика и способ ее употребления подбираются так, чтобы они были привычны пользователю. Проанализиро- вав профиль человека, с которым происходит общение, можно получить ин- формацию о его возрасте, деятельности и интересах, и далее сделать вывод о необходимости использования той или иной лексики и подобрать харак- теристики будущей фразы (её тональность и стиль). Программная система в процессе общения относит пользователя, с которым она ведет диалог, к определенной группе, и начинает использовать онтологии, соответствующие данной группе. Фраза строится на основе харктеристик тональности фразы и её стиля. 1. Тональность фразы задается наличием эмоционально окрашенной лек- сики. При порождении фразы, имеющей заданную тональность, подби- раются соответствующие синонимы. 2. Стиль фразы определяется классом пользователей, к которому принад- лежит собеседник. В соответствии с стилем выбираются нужная лекси- ка, задаваемая соответствующей онтологией. Построение фразы происходит на основе шаблонов с использованием принципов порождающей грамматики Хомского [6]. Каждое предложение состоит из именной группы и группы сказуемого. Именная группа состо- ит из определителя и определяемого, где определитель может опускаться. Группы могут содержать в себе прилагательные, наречия и т.д. Согласование слов в предложении осуществляется за счет использования сторонних морфологических библиотек. 3 Заключение В рамках данной работы были разработаны методы порождения фраз естественного языка по заданной OWL-модели, определяющей семантику фразы, и заданной прагматике фразы. Разработана программная система, реализующая данные методы. Используя вышеописанный подход, можно решить проблему согласова- ния пользовательской и программной онтологии и значительно повысить эффективность обмена знаниями между клиентом и виртуальным помощ- ником. Виртуальный помощник при построении фразы учитывает не только модель ситуации, но и набор характеристик пользователя, с которым про- исходит общение, что гарантирует понимание сторон и увеличивает доверие к помощнику. Список литературы 1. Пальчунов, Д. Е. Моделирование мышления и формализация рефлексии I: Теоретико-модельная формализация онтологии и рефлексии. // Философия на- уки. 2006. № 4 (31). С. 86-114. 194 2. Carnap, R. Meaning and Necessity. // A Study in Semantics and Modal Logic. 1956. 3. Пальчунов, Д. Е. Решение задачи поиска информации на основе онтологий. // Бизнес-информатика. 2008. № 1. С. 3-13. 4. Пальчунов, Д. Е., Целищев , B. B. Проблема извлечения знаний в системе взаи- модействия человека и компьютера (онтологии и пресуппозиции) // Философия науки. 2012. № 4. С. 20-35. 5. Frege, G. Über Sinn und Вedeutung / Zeitschrift für Philosophie und philosophische Kritik. s. 25–50. 1892. 6. Chomsky, N. Syntatic Structures — Berlin: Mouton de Gruyter, 2002, Р. 119. 7. Пальчунов, Д. Е. Моделирование мышления и формализация рефлексии. Ч.2. Онтологии и формализация понятий. //Философия науки. 2008. № 2(37). C. 62– 99. 195 Automatic Natural Language Generation Using an OWL Model, Semantics and Pragmatics Polina Sazonova Novosibirsk State University, Novosibirsk, Russia psazonova@gmail.com Abstract. This paper is focused on the problem of agreement between the ontology of a user and of a computer program. The natural language generation algorithms which use an OWL model, semantics and pra- gramtics have been studied. The present solution can be used to increase the interaction efficency between users and virtual assistants on websites specialized on selling goods and services. Keywords: ontology, OWL, virtual assistant, pragratics, semantics, NLP. 196