Library
|
Your profile |
Cybernetics and programming
Reference:
Zhitko V.A.
Intelligent user interface for question answering systems
// Cybernetics and programming.
2012. № 1.
P. 23-30.
DOI: 10.7256/2306-4196.2012.1.13862 URL: https://en.nbpublish.com/library_read_article.php?id=13862
Intelligent user interface for question answering systems
Received: 20-11-2014Published: 04-12-2014Abstract: Due to the rapid development and spread of computer systems in various spheres of human activity is to reduce the actual cost of training new and adapting already active users of new versions of systems. To the greatest extent this applies to the field of information and information systems. It is caused by a wide variety of applications, ranging from bying tickets online to complex customer support systems. The variety of such systems and the principles of interaction with them, used in practice, hinders their free use. Promising in this case is the use of a natural language familiar to the user for a dialogue with computer systems. Using the familiar to the user natural language for dialogue with computer systems is implemented by means of natural language and speech in user interface, which has a number of advantages: minimal user training to work with the system (depends on the specific implementation of the system and its operating capacity), simplicity and high speed setting arbitrary requests to the system and the high level of the domain model (is like one of the benefits, as well as a prerequisite for the successful implementation of such systems). Keywords: natural language user interface, question-answer system, component design, semantics, intelligent systems, morphological analysis, knowledge base, output machine, interface, trainingИспользование привычного для пользователя естественного языка для организации диалога с компьютерными системами реализуется средствами естественно-языкового и речевого пользовательского интерфейса, обладающего рядом преимуществ: минимальной подготовкой пользователя для работы с системой (во многом зависит от конкретной реализации системы и ее операционных возможностей), простотой и высокой скоростью задания произвольных запросов к системе и высоким уровнем модели предметной области (является как одним из преимуществ, так и необходимым условием успешного внедрения подобных систем). Использование речевого синтеза при этом позволяет снизить нагрузку на пользователя по восприятию результатов обработки используя не графический интерфейс (зрительную систему), а посредством речи, а так же являясь, при использовании синтеза речи, более привычной формой человеческого взаимодействия — диалогом. Кроме того, языковой ввод команд и вопросов позволяет пользователю использовать эту же систему в качестве справочной и получать от неё помощь в исполнении любой другой деятельности (получение справки при выполнении технических работ и т.д.). Одной из основных характеристик систем с естественно-языковым интерфейсом является высокий уровень модели предметной области. Это может достигается посредством применения семантических подходов в хранении и обработки информации. В частности, может быть применена технология интеллектуальных систем OSTIS [1], обеспечивающая хранение строго структурированной информации (знаний) различных предметных областей в единой базе знаний, а также ее обработка посредством использования агентно-ориентированного подхода. Такой подход обеспечивает значительный уровень модульности, что позволяет производить подстройку системы к определенным условиям ее эксплуатации. Следует отметить, что для естественно-языкового пользовательского интерфейса вопросно-ответных систем возможно использование ограниченного набора лексики и грамматики языка без серьёзного ущерба функциональности вопросно-ответной системы. Ограниченный естественный язык – это подмножество естественного языка, текст на котором без каких-либо усилий воспринимается носителем исходного естественного языка, а также не требует длительного изучения для приобретения навыков составления текстов на этом языке, т.к. обладает сокращенным набором лексики и грамматики. Это позволяет снизить время обработки естественно-языковых конструкций в вопросно-ответной системе, а также частично избежать лингвистических неоднозначностей. Естественно-языковой пользовательский интерфейс в рамках разрабатываемой технологии компонентного проектирования рассматривается нами как специализированная интеллектуальная система, обеспечивающая диалог между прикладной вопросно-ответной системой и пользователем в заданной предметной области. Таким образом, будучи интеллектуальной системой, естественно-языковой интерфейс, как и любая другая подобная система, в качестве основных своих компонентов имеет базу знаний, машину обработки знаний и пользовательский интерфейс. Определим здесь следующие основные функциональные возможности естественно-языкового интерфейса: - возможность ввода сообщения в естественно-языковой форме посредством текста или речи; - трансляция сообщения пользователя на внутренний язык интеллектуальной системы; - трансляция ответа системы в тексты естественного языка в форме текста или речи. Указанный функционал определяет структуру интеллектуальной системы естественно-языкового интерфейса, которая включает следующие составляющие: - пользовательский интерфейс, посредством которого происходит ввод сообщений пользователя и вывод ответа системы пользователю; - трансляторы естественно-языковых запросов на внутренний sc-язык вопросов; - трансляторы конструкций sc-языка (sc‑конструкций) на естественный язык. Центральным компонентом таких систем должен выступать компонент обработки знаний — машина обработки знаний. Машина обработки знаний естественно-языкового интерфейса включает в себя операции, обеспечивающие обработку различных лингвистических конструкций, перевод внешних языков на семантические языки интеллектуальной системы и обратно. Все компоненты машины обработки знаний естественно-языкового интерфейса можно разделить на трансляторы и анализаторы. Задачей трансляторов является перевод знаний из одного языка представления знаний в другой, например, трансляция фактографических знаний по предметной области в текст на естественном языке. Задачей анализаторов является анализ фрагментов знаний и выявление ранее неизвестных фактов, например, анализ запроса пользователя, направленный на поиск цели и задачи вопроса. Трансляторы естественно-языкового интерфейса в минимальной конфигурации должны включать в себя транслятор ограниченного естественного языка на язык вопросов и транслятор фактографических знаний на ограниченный естественный язык. Трансляторы естественно-языкового пользовательского интерфейса осуществляют обработку информационных структур, полагаясь исключительно на описание синтаксиса используемого языка, а также на описание семантики предметной области. Описание синтаксиса используемого языка хранится в лингвистической и предметной базах знаний. В лингвистической базе знаний должны быть также описаны специфические для данной области знания о языке. Такой фрагмент базы знаний может представлять собой отдельный ip-компонент, т.к. он представляет ценность только в совокупности с предметной и лингвистической базой знаний. Цикл работы естественно-языкового интерфейса начинается с ввода пользователем сообщения на естественном языке путём ввода текста или голосового (речевого) сообщения. По введенному в систему тексту строится его формальное описание в памяти системы [2]. Все предшествующие результаты анализа используются при анализе последующих запросов, что позволяет системе сохранять ход диалога с пользователем и разрешать спорные моменты, связанные с использованием одних и тех же терминов в разных предметных областях. Первым этапом анализа запроса пользователя является морфологический анализ. На данном этапе для каждой словоформы в формальной записи предложения строятся отношения, задающие соответствия значениям её грамматических категорий (род, падеж, склонение и т.д.). На следующем этапе – этапе синтаксического анализа – строятся отношения синтаксических связей внутри предложения, выделяются главные и второстепенные члены предложения, выявляется тип предложения и т.д. Синтаксический анализ выполняется поэтапно, “наращивая” формальное описание структуры предложения с использованием информации, полученной на этапе морфологического анализа. На данном этапе используются лексические и синтаксические правила анализируемого языка. Результатом этапа синтаксического анализа является формальное описание синтаксического разбора предложения в базе знаний естественно-языкового интерфейса [3]. На следующем этапе – семантического анализа – строятся отношения эквивалентности элементов предложения и узлов предметной области в памяти системы. Этап семантического анализа является наиболее сложным этапом обработки естественно-языкового текста [4]. В рамках используемой технологии семантический анализ представляет собой обработку семантической сети, отражающей результат анализа естественно-языкового текста на всех предыдущих этапах, а также присутствующих в системе знаний о языке и предметной области основной системы. На этом этапе происходит анализ соотношения лингвистической конструкции и конструкций, хранящихся в памяти системы для выявления отношений соответствия, эквивалентности и т.д. Результатом семантического анализа является конструкция запроса к системе. Сложность получения такого результата связана с возможной семантической неполнотой исходного естественно-языкового вопроса, что тем не менее вполне естественно для предложений естественного языка [5]. Например, вопрос: «Какими свойствами обладают биссектрисы треугольников?» в семантически полном (развернутом) полуформальном виде будет выглядеть следующим образом: «Какие утверждения являются общими для понятия треугольник и понятия биссектриса?». Из примера видно, что в процессе развертки произошли следующие подстановки: высказывание «обладать свойствами» было развернуто в «иметь общие утверждения», «свойства» – в «утверждения», «биссектрисы» – в «понятие биссектриса», «треугольники» – в «понятие треугольник». Ответ на данный вопрос будет следующим: «У любого треугольника все биссектрисы пересекаются в одной точке» Вопросы, сгенерированные естественно-языковым интерфейсом, обрабатывает универсальный решатель вопросно-ответных систем, являющийся частью вопросно-ответной системы по соответствующей предметной области. Стоит заметить, что универсальный решатель использует знания и лингвистической базы знаний. Таким образом система может отвечать на вопросы, связанные с используемым естественным языком. Полученный от предметной справочной системы ответ транслируется в текст на ограниченном естественном языке, который в результате выводится пользователю [6]. References
1. Proekt OSTIS [Elektronnyi resurs]. Minsk, 2011. – Rezhim dostupa: http://ostis.net/. – Data dostupa: 11.12.2011.
2. Byron Long, Natural Language as an Interface Style / Byron Long // Dynamic Graphics Project Department of Computer Science University of Toronto, 1994. 3. Suleimanov D.Sh. Dvukhurovnevyi lingvisticheskii protsessor otvetnykh tekstov na estestvennom yazyke yazyke / Suleimanov D.Sh. // sbornik trudov Mezhdunarodnoi nauchno-tekhnicheskoi konferentsii OSTIS-2011, Minsk, 2011 / BGUIR – Minsk, 2011 4. Apresyan, Yu. D. Izbrannye trudy, tom II. Integral'noe opisanie yazyka i sistemnaya leksikografiya / Yu. D. Apresyan – Moskva: Shkola «Yazyki russkoi kul'tury», 1995. 5. Popov, E.V. Obshchenie s EVM na estestvennom yazyke / E.V. Popov. – Moskva: Nauka, 1982. 6. Algoritmy porozhdeniya predlozhenii estestvennogo yazyka (obzor i analiz) / T.P. Karpilovich. – Minsk, 1977. |