DOI: 10.7256/2306-4196.2013.2.8307
Received:
18-03-2013
Published:
1-04-2013
Abstract:
The work is devoted to the basic principles underlying the design of complex technique of semantic models of knowledge bases of intelligent information systems. The knowledge base is one of the key components of intelligent systems for various purposes. In developing the knowledge base is essential to ensure not only the ability to store knowledge and navigate through it, but also the opportunity to work on the creation and modification of knowledge distributed team of developers. The paper proposes a technology for component design of a knowledge base, based on unified semantic networks with the basic set-theoretic interpretation. This technology is a set of models, tools and methods for the design of knowledge bases. Semantic model of intellectual system knowledge base is a formal interpretation of the semantic space, which is known for intelligent system at the current time. This model is part of the technology component design knowledge base of intelligent systems based on semantic networks.
Keywords:
design, semantic model, knowledge base, semantic space, intelligent system, semantic network, systematization, structuring, technology, verification
Введение В настоящее время все более актуальной становится задача эффективного информационного обеспечения научной и производственной деятельности, связанная с бурным ростом объемов информации в различных отраслях знаний. Данная задача, как правило, рассматривается в контексте создания хранилищ знаний и их систематизации и структуризации с целью облегчения их обработки.
База знаний является одним из ключевых компонентов интеллектуальных систем различного назначения [2],[3],[5]. Разработка этого компонента является трудоемким и продолжительным процессом.
При разработке баз знаний важно обеспечить не только возможность хранения знаний и навигации по ней, но и возможность работы над созданием и изменением базы знаний распределенным коллективом разработчиков.
На сегодняшний день существует ряд проблем, в области формирования баз знаний [4]: доступность семантического контента; доступность баз знаний и средств их разработки; эволюция баз знаний; масштабируемость баз знаний; мультиязычность баз знаний; стабильность баз знаний; визуализация баз знаний.
В качестве решения вышеуказанных проблем предлагается технология компонентного проектирования баз знаний, основанная на унифицированных семантических сетях с базовой теоретико-множественной интерпретацией. Данная технология представляет собой комплекс моделей, инструментальных средств и методов проектирования баз знаний. Технология компонентного проектирования баз знаний интеллектуальных систем В основе предлагаемой технологии лежат следующие основные принципы массовой семантической технологии проектирования интеллектуальных систем OSTIS (Open Semantic Technology for Intelligent Systems) [6]:
- поэтапное эволюционное проектирование баз знаний на основе быстрого прототипирования;
- ориентация на коллективное проектирование баз знаний в рамках Open Source проекта;
- ориентация на семантическое представление знаний;
- унификация моделей баз знаний интеллектуальных систем;
- модульное проектирование на основе библиотек типовых многократно используемых компонентов.
Технология проектирования баз знаний представляет собой комплекс моделей, инструментальных средств и методов проектирования баз знаний.
Предлагаемая технология имеет следующую структуру:
- унифицированная семантическая модель представления знаний
- семантическая модель базы знаний;
- библиотека многократно используемых компонентов баз знаний;
- средства проектирования семантических моделей баз знаний;
- методика проектирования семантических моделей баз знаний.
С формальной точки зрения, технология проектирования материализуется в виде интеллектуальной метасистемы для поддержки проектирования баз знаний. Унифицированная семантическая модель представления знаний В качестве формальной основы проектируемых логико-семантических моделей баз знаний интеллектуальных систем используются графодинамические модели специального вида – семантические модели представления и обработки знаний, в основе которых лежат унифицированные семантические сети с базовой теоретико-множественной интерпретацией. Основным способом кодирования информации для таких сетей является SC-код (Semantic Code) [3].
Все элементы (атомарные фрагменты) семантической сети являются знаками различных сущностей. Такими сущностями могут быть всевозможные внешние описываемые объекты, а также различные множества, состоящие их элементов (атомарных фрагментов) этой же семантической сети.
База знаний интеллектуальной системы, представленная в виде корректно построенной семантической сети, полностью исключает дублирование информации в рамках такой базы знаний.
Представление знаний в виде унифицированных семантических сетей позволяет существенно упростить процедуру ассоциативного доступа к различным видам фрагментов хранимой базы знаний, а также существенно расширить типологию запросов к базе знаний [3]. Семантическая модель базы знаний В основе разработки баз знаний с помощью технологии OSTIS лежит четкое разделение процесса проектирования формального описания семантической модели разрабатываемой базы знаний от процесса реализации (интерпретации) этой модели на той или иной платформе [3]. Данный факт позволяет обеспечить кросс-платформенную разработку интеллектуальных систем.
Всю семантическую сеть (максимальную семантическую сеть), хранимую в семантической памяти абстрактной логико-семантической модели интеллектуальной системы, будем называть абстрактной семантической моделью базы знаний этой интеллектуальной системы.
Семантическая модель базы знаний интеллектуальной системы представляет собой формальную трактовку семантического пространства, которое известно интеллектуальной системе в текущий момент времени.
Эффективность интеллектуальной системы в первую очередь определяется объемом и качеством содержащихся в них формализованных экспертных знаний, как декларативных (теоретических), так и процедурных (практических навыков).
База знаний должна содержать в себе всю информацию, необходимую агентам, работающим над семантической памятью, для организации коллективной деятельности по решению задач, с которыми должна справляться интеллектуальная система.
Для расширения разнообразия видов знаний, хранимых в базе, необходимым этапом в разработке семантической модели базы знаний является ее структуризация.
Понятие базы знаний тесно связано с понятием предметной области. Соотношение между базой знаний и описываемой ею предметной областью задает семантику базы знаний интеллектуальной системы.
Рассмотрение структуры базы знаний во взаимосвязи с предметной областью позволяет рассматривать исследуемые объекты на разных уровнях детализации. Детализацию рассмотрения исследуемых объектов можно осуществлять как в рамках исходной предметной области, так и в системе самостоятельных, но связанных между собой предметных областей.
При переходе от предметной области к ее модели, представленной в виде семантической сети, выполняются следующие условия:
- каждому элементу предметной области взаимно однозначно соответствует обозначающий его элемент семантической сети;
- каждому сигнатурному элементу предметной области взаимно однозначно соответствует либо обозначающий его ключевой узел семантической сети, либо обозначающий элемент алфавита семантической сети.
Первым и важнейшим этапом проектирования семантической модели базы знаний является уточнение структуры описываемой предметной области или нескольких взаимосвязанных предметных областей. Под уточнением структуры предметной области понимается явное выделение класса исследуемых объектов, класса вторичных объектов, построенных на основе исследуемых, класса вспомогательных объектов, через связи с которыми описываются некоторые характеристики исследуемых объектов, отношения, связки которых связывают только исследуемые объекты между собой, а также отношения, связки которых связывают исследуемые объекты со вспомогательными.
Рассмотрение базы знаний с позиции ее соотношения с предметной областью позволяет рассматривать исследуемые объекты на различных уровнях детализации:
- классификация класса исследуемых объектов по различным признакам;
- классификация самих исследуемых объектов, т.е. рассмотрение структур взаимосвязанных частей этих объектов;
- рассмотрение связей исследуемых объектов со вспомогательными объектами, не входящими в класс исследуемых объектов.
В зависимости от исследуемых объектов можно говорить о достаточно богатой типологии предметных областей. Можно выделить следующие классы предметных областей:
- предметная область, описывающая теоретико-множественные характеристики и связи заданного семейства объектов. Такие предметные области, в частности, могут быть онтологиями других предметных областей;
- терминологическая онтология – это класс предметных областей, для каждой из которых объектами исследования являются термины (словосочетания), соответствующие различным элементам описываемой предметной области;
- предметная область, являющаяся логическим описанием некоторой предметной области – это класс предметных областей, для каждой из которых объектами исследования являются всевозможные логические формулы, описывающие причинно-следственные закономерности, интерпретируемые на некоторой описываемой предметной области;
- логическая система понятий, описываемых в заданной формальной теории. Эта предметная метаобласть выделяет класс понятий, не определяемых в заданной формальной теории, и связывает каждое определяемое понятие с теми понятиями, на основе которых оно определяется;
- логическая система утверждений заданной формальной теории. Эта предметная мтеаобласть выделяет класс аксиом для заданной формальной теории, каждой теореме ставит в соответствие одно из её доказательств (основное доказательство) и связывает каждую теорему со всеми теми утверждениями и определениями, которые используются в основном доказательстве этой теоремы;
- предметная область вопросов и информационных задач – это класс предметных областей, для каждой из которых объектами исследования являются вопросы, информационные задачи, обобщенные вопросы и обобщенные информационные задачи, задаваемые по отношению к некоторой описываемой предметной области, а также соответствующие им способы решения информационных задач (то есть различные программы).
Семантическая структура базы знаний интеллектуальной системы трактуется в рамках технологии проектирования баз знаний интеллектуальных систем как иерархическая система взаимосвязанных между собой предметных областей, которые представляются в базе знаний.
На множестве предметных областей могут быть заданы следующие отношения: включение, объединение, пересечение, декомпозиция, гомоморфизм, изоморфизм, теоретико-множественная онтология, логическое описание, логическая онтология. Исходя из этого, мы можем рассматривать некую метаобласть, объектами исследования которой являются всевозможные предметные области.
Таким образом, семантическая структура базы знаний представляет собой иерархическую систему описываемых ею предметных областей, надстраиваемых над заданной основной предметной областью.
Построение семантической структуры базы знаний требует не только явного представления спецификации каждой описываемой предметной области в виде формального текста, но и явного описания всевозможных связей между этими предметными областями. Библиотека многократно используемых компонентов баз знаниий интеллектуальных систем В целях сокращения времени процесса проектирования семантических моделей баз знаний интеллектуальных систем необходимо создать библиотека многократно используемых семантически совместимых компонентов баз знаний. На основе этой библиотеки разработана методика компонентного проектирования баз знаний.
К основным типам компонентов баз знаний, хранящихся в библиотеке относятся:
- онтологии различных предметных областей, которые могут быть самыми различными по содержанию, однако должны быть семантически совместимыми;
- базовые фрагменты теорий, соответствующие различным уровням знания пользователя, начиная от базового школьного до профессионального;
- семантические окрестности различных объектов;
- спецификации формальных языков описания различных предметных областей.
Для обеспечения семантической совместимости таких компонентов баз знаний, которые являются унифицированными семантическими моделями, необходимо
- согласовать семантику всех используемых ключевых узлов;
- согласовать глобальные идентификаторы ключевых узлов, используемых в разных компонентах. После этого интеграция всех компонентов, входящих в состав библиотеки, и в любых комбинациях осуществляется автоматически, без вмешательства разработчика.
Для включения компонента в библиотеку необходимо его специфицировать по следующим критериям:
- предметная область, описание которой содержится в компоненте;
- класс (тип) компонента базы знаний;
- состав базы знаний;
- количественные характеристики ключевых узлов базы знаний;
- информация о разработчиках базы знаний;
- дата создания базы знаний;
- информация о верификации базы знаний;
- версия компонента базы знаний;
- условия распространения компонента базы знаний;
- сопровождающая информация.
Заключение В данной работе рассмотрена семантическая модель базы знаний интеллектуальной системы. Данная модель входит в технологию компонентного проектирования баз знаний интеллектуальных систем, основанную на семантических сетях.
Результаты, приведенные в работе, апробируются в рамках открытого проекта OSTIS [6].
References
1. Gavrilova T. A., Khoroshevskii, V. F. Bazy znanii intellektual'nykh sistem. Uchebnik / Gavrilova T.A.. [i dr.]; – SPb.: Izd-vo «Piter», 2001.
2. Gavrilova, T. A., Gulyakina, N.A. Vizual'nye metody raboty so znaniyami: popytka obzora / T. A. Gavrilova, N. A. Gulyakina // Iskusstvennyi intellekt i prinyatie reshenii, 2008, № 1, S. 15-21
3. Golenkov, V. V., Gulyakina N. A. Grafodinamicheskie modeli parallel'noi obrabotki znanii: printsipy postroeniya, realizatsii i proektirovaniya. – V kn Mezhdunar. nauchn.-tekhn. konf. . «Otkrytye semanticheskie tekhnologii proektirovaniya intellektual'nykh sistem» (OSTIS-2012). Materialy konf. [Minsk, 16-18 fevr. 2012 g.]. – Minsk: BGUIR, 2012.
4. Efimenko, I. V., Khoroshevskii, V. F. Ontologicheskoe modelirovanie ekonomiki predpriyatii i otraslei sovremennoi Rossii: Chast' 1. Ontologicheskoe modelirovanie: podkhody, modeli, metody, sredstva, resheniya: preprint WP7/2011/08 (ch. 1) / I. V. Efimenko, V. F. Khoroshevskii; Nats. issled. un-t «Vysshaya shkola ekonomiki». – M.: Izd. dom Vysshei shkoly ekonomiki, 2011. – 76 s.
5. Khoroshevskii, V. F. Prostranstva znanii v seti Internet i Semantic Web (Chast' 1) / V. F. Khoroshevskii // Iskusstvennyi intellekt i prinyatie reshenii.-2008.-№ 1.-S.80-97.
6. Proekt OSTIS [Elektronnyi resurs]. Minsk, 2012. – Rezhim dostupa: http://ostis.net/. – Data dostupa: 11.12.2012.
7. N.A. Gulyakina, I.T. Davydenko, D.V. Shunkevich Metodika proektirovaniya semanticheskoi modeli intellektual'noi spravochnoi sistemy, osnovannaya na semanticheskikh setyakh // Programmnye sistemy i vychislitel'nye metody. - 2013. - 1. - C. 56 - 68. DOI: 10.7256/2305-6061.2013.01.5.
|