Инструментальная среда формирования баз знаний для

advertisement
Инструментальная среда приобретения знаний для
прикладных экспертных систем
Макаров Д. А.
В работе рассматриваются проблемы приобретения знаний от экспертов в
различных областях, описываются принципы построения и функционирования
инструментальной среды приобретения знаний для прикладных экспертных
систем, сделаны выводы о методах её дальнейшего развития и возможных
областях внедрения.
Введение
В начале восьмидесятых годов прошлого столетия в области искусственного
интеллекта сформировалось самостоятельное направление, получившее название
экспертные системы (ЭС). Основным источников знаний для ЭС систем являются
эксперты в соответствующих областях. Многие исследователи рассматривают
получение знаний от экспертов в качестве одного из главных «узких мест»
технологии экспертных систем [1]. Существует множество причин подобному
положению дел. Выделим некоторые из них [2, 3]:
1) Использование экспертами узкоспециализированных терминов с
неочевидным для неспециалиста смыслом.
2) Невозможность формализации в терминах математической теории
большого числа знаний и фактов, используемых экспертом при решении
задач.
3) Обширный контекст экспертного анализа: очень многие знания,
используемые экспертом, кажутся ему само собой разумеющимися, но
для постороннего отнюдь таковыми не являются.
4) Эксперты не хотят делиться своим опытом.
5) Эксперты не хотят вводить данные в экспертную систему, мотивируя это
недружественностью
интерфейса,
боязнью
что-то
испортить,
собственной занятостью и т.д.
6) Ни один эксперт не обладает полными знаниями в своей предметной
области.
Помимо перечисленных трудностей можно отметить также недостаток
квалифицированных инженеров по знаниям, способных эффективно осуществить
перенос компетентности специалиста в ЭС, отсутствие удобных и эффективных
средств приобретения знаний. Все это привело к тому, что ЭС не смогли получить
повсеместное распространение и внедрение. Для преодоления этих проблем были
созданы системы автоматизированного приобретения знаний, позволяющие
повысить эффективность работы инженера по знаниям и, следовательно,
сократить время на создание прикладной ЭС.
Описание и функциональные характеристики среды приобретения
знаний
Рассматриваемая среда приобретения знаний является дальнейшим
развитием идей заложенных в систему SIMER, входящую в состав программного
комплекса построения ЭС SIMER+MIR [4]: база знаний (БЗ) представляет собой
неоднородную семантическую сеть (рисунок 1), процесс приобретения знаний
осуществляется по средствам прямого диалога среды с экспертом или инженером
по знаниям.
Рисунок 1 – Пример неоднородной семантической сети
Среда приобретения знаний обладает следующими функциональными
характеристиками:
1) Возможность создания и редактирования БЗ. Основные элементы БЗ
будут рассмотрены ниже.
2) Возможность работы непосредственно с экспертами для формирования
БЗ. Прямое приобретение знаний от экспертов позволяет снизить
нагрузку на инженера по знаниям и одновременно уменьшить
субъективность переносимых знаний.
3) Возможность объединения БЗ, созданных различными экспертами.
Данное свойство призвано устранить проблему неполноты знания
отдельного эксперта благодаря использованию БЗ, полученных ранее.
Кроме того, возможно одновременное приобретение знаний от
нескольких экспертов и последующее их объединение, что ведет к
сокращению времени создания прикладных ЭС. При объединении
необходимо
устранить
избыточность
данных,
обеспечить
непротиворечивость и поддержку целостности. Под избыточностью
понимается дублирование элементов БЗ. Наличие избыточности может
привести к нарушению уникальности имен БЗ и целостности данных.
Непротиворечивость означает отсутствие принадлежащих одному и тому
же типу элементов БЗ отличающихся внутренней структурой. Например,
объекты одного класса не могут обладать разным числом атрибутов. Под
целостностью данных понимается условие выполнения уникальности
имен объектов, типов связей, разделов и типов связей и условие
выполнения ссылочной целостности: элементы БЗ не могут ссылаться на
несуществующие элементы БЗ. Возникающие в процессе объединения
конфликты разрешаются инженером по знаниям.
4) Возможность производить отмену произведенных в БЗ изменений.
Позволяет уменьшить боязнь эксперта при работе со средой.
5) Возможность конвертации БЗ, созданных с помощью программного
комплекса SIMER+MIR.
6) Высокая производительность базы знаний. Достигается использованием
кроссплатформенного на уровне исходного кода модуля управления
базами знаний, реализованного на языке С++. Более подробное описание
модуля буде приведено ниже. Кроме того, высокая производительность
ЭС достигается использованием файла, хранящего скомпилированные
процедуры БЗ, участвующие в работе решателя.
7) Возможность создания новых типов связей, что увеличивает
описательные возможности среды приобретения знаний и, как следствие,
область её потенциального применения.
Основными элементами БЗ являются:
1) Объекты.
2) Классы.
3) Типы связей.
4) Разделы.
5) Глобальные функции и переменные.
Объекты являются основными составляющими БЗ и служат для
представления объектов предметной области. Например, объектами могут быть
утверждения, факты, рекомендации, результаты наблюдений и так далее. Объекты
в БЗ организованы по принципу схожему с объектно-ориентированным подходом:
каждый объект обладает классом, от которого наследует множество атрибутов,
процедур и связей. Кроме того, объект характеризуется уникальным именем и
является либо признаком, либо гипотезой. Признаками называют те объекты, от
которых зависит ход рассуждения работы ЭС. Гипотезами называют объекты,
которые формируют решение, то есть результат работы ЭС. Для повышения
описательных возможностей объекты могу обладать процедурами и связями не
определенными в классе объекта.
Классы предназначены для упрощения создания объектов БЗ и
характеризуются уникальным среди других классов именем, набором атрибутов,
процедур и связей. Атрибуты класса характеризуются уникальным в пределах
класса именем, типом, областью значений и задают существенные признаки
класса объекта. Например, атрибутами класса Машина могут выступать марка
машины, вес, цвет, мощность двигателя и так далее. В качестве типа свойства
класса может выступать: строка, перечисление или вещественное число. Область
значения атрибута определяет множество возможных значений, которое он может
принимать. Для атрибутов типа строка множество значений не определяется, для
атрибутов вещественного типа множество значений задается с помощью
определения диапазона значений, для перечисления – прямым перечислением
возможных значений. При создании объекта область значения его атрибутов
может быть сужена.
Процедуры служат для реализации поведения объекта. Они могут изменять
внутреннее состояние объекта, то есть значения его атрибутов, а также изменять
глобальные переменные и вызывать глобальные функции, которые являются
общими для всех процедур. Процедуры реализуются на языке C++ и перед
работой решателя компилируются в отдельный файл.
Типы связей служат для описания связей между объектами предметной
области. Типы связей характеризуется уникальным среди других типов связей
именем, характеристикой, процедурой обработки, силой типа связи и знаком.
Характеристика типа связи задает текстовую интерпретацию семантики связи и
всегда описывает связь в оба направления. Процедура обработки реализует саму
семантику связи и вызывается при работе решателя ЭС. Знак связи характеризует
влияние наличия связи на множество возможных гипотез. Положительные типы
связи усиливают вероятность некоторых гипотез, отрицательные – уменьшают.
Сила типа связи характеризует степень влияния связи на множество возможных
гипотез. В среде присутствуют 12 встроенных типов связей (таблица 1). Прямая и
обратная характеристики описывают связь как в прямом, так и в обратном
направлении. Например, связь типа TRA-ART между объектом A и B
интерпретируется следующим образом: при наблюдении объекта A всегда
наблюдается объект B и при наблюдении объекта B может наблюдаться объект A.
Таблица 1 – Встроенные типы связей
Название
типа связи
Прямая
характеристика
Обратная
характеристика
Знак
типа
связи
Сила
типа
связи
TRA-ART
всегда наблюдается
может наблюдаться
+
1
TRA-TRA
всегда наблюдается
всегда наблюдается
+
1
TRA
всегда наблюдается
неизвестно про
+
1
ART-TRA
может наблюдаться
всегда наблюдается
+
0,7
RS-RS
может наблюдаться
может наблюдаться
+
0,5
RS
может наблюдаться
неизвестно про
+
0,5
SN-NS
всегда отсутствует
может отсутствовать
–
1
SN-SN
всегда отсутствует
всегда отсутствует
–
1
всегда отсутствует
неизвестно про
–
1
NS-SN
может отсутствовать
всегда отсутствует
–
0,7
S-S
может отсутствовать
может отсутствовать
–
0,5
S
может отсутствовать
неизвестно про
–
0,5
SN
Однако, зачастую этих типов связей не достаточно, чтобы описать
специфичные для предметной области отношения между объектами. Поэтому,
предусмотрена возможность создания собственных типов связей, что позволяет
описывать широкий класс предметных областей. Например, можно создать тип
связей, характеризующий отношение «часть-целое», что позволит описать
сложную иерархию объектов.
Все объекты БЗ сгруппированы по разделам. Один и тот же объект может
находиться в нескольких разделах. Имя объекта не должно совпадать с именем
раздела.
В процессе приобретения знаний участвуют инженер по знаниям и один или
несколько экспертов. Инженер по знаниям вместе с экспертом или экспертами
должен провести анализ предметной области и построить её модель. На основании
полученной модели он формирует разделы, создает классы объектов и
необходимые типы связей. В дальнейшем эксперт или эксперты создают объекты,
описывающие предметную область, проставляют связи между ними. Связи
устанавливаются исходя из их текстовой интерпретации (рисунок 2), что
освобождает эксперта от необходимости запоминания имен типов связей и их
семантики.
Рисунок 2 – Окно для создания связи между объектами
Инженер по знаниям следит за правильностью ввода данных экспертами и
при необходимости создает новые классы, типы связей, процедуры объектов,
оказывает консультационную помощь.
Общая схема программного комплекса инструментальных средств
создания экспертных систем
Инструментальная среда приобретения знаний для прикладных экспертных
входит в состав программного комплекса инструментальных средств создания
экспертных систем, структура которого представлена на рисунке 3.
Рисунок 3 – Структура программного комплекса
Среда приобретения знаний реализована на языке C# и предназначена для
работы под управлением операционных систем (ОС) Windows XP и выше,
поскольку большинство экспертов в различных областях знакомо именно с этим
семейством ОС. База знаний представляет собой XML файл и доступ к ней
осуществляется через специальный кроссплатформенный на уровне исходного
кода модуль управления БЗ (МУБЗ), содержащий сервисные программы. МУБЗ
предоставляет элементарные операции для чтения и редактирования БЗ,
процедуры вывода, используемые решателем ЭС, поддерживает дополнительную
функциональность, например, преобразование БЗ из одного формата в другой,
проверка целостности БЗ и так далее.
Крайний правый компонент схемы предназначен для осуществления вывода
решений. Базовый решатель поддерживает общие методы вывода и определяет
абстрактные методы, которые могут быть реализованы в конкретных прикладных
решателях, унаследованных от базового. Базовый Windows-интерфейс
взаимодействует с базой знаний через базовый решатель. На основе базового
интерфейса будут создаваться предметно-зависимые интерфейсы прикладных
систем. WEB-интерфейс имеет схожее с Windows-интерфейсом предназначение и
служит для создания предметно-зависимых интерфейсов для удаленного доступа к
ЭС.
Кроссплатформенность
и
«легковесность»
МУБЗ
предоставляет
возможность применения ЭС в широком спектре приложений при наличии
соответствующего решателя. Например, ЭС может быть установлена на
автономное транспортное средство.
Заключение
Разработанная среда приобретения знаний призвана устранить трудности,
связанные с переносом компетентности специалистов в различных областях в ЭС
благодаря прямому приобретению знаний от экспертов и наличию возможности
объединения нескольких баз знаний. Поддержка возможности создания
специфических для предметной области отношений позволяет создавать сложные
иерархии объектов и расширить область возможного применения среды.
Важной особенностью среды является использование схожего с объектноориентированным подхода к созданию основных элементов базы знаний –
объектов. Что позволяет улучшить структурирование знаний эксперта и упростить
процесс описания объектов предметной области.
Дальнейшим усовершенствованием среды приобретения знаний может
являться встроенная справочная система, которая позволит сделать работу среды
более понятной. Также необходима система анализа БЗ с целью выявления
созданных, но неиспользованных элементов БЗ (например, классов объектов,
глобальных функций и переменных), несвязанных ни одной связью объектов или
объектов, никак не влияющих на результат работы ЭС.
На данный момент среда приобретения знаний была использована при
создании БЗ для прикладных ЭС «Вертебрология» и «Психодиагностика» [5]. В
дальнейшем областью применения могут являться проекты по созданию ЭС для
таких слабоструктурированных областей как социология, демография, военное
дело и других, проекты по усовершенствованию ЭС, созданных с помощью
SIMER+MIR, а также среда может использоваться в качестве программы для
обучения специалистов, занятых созданием экспертных систем.
Литература
1 Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем.
– Питер, 2000. – 384 с.
2 Джексон П. Введение в экспертные системы: Пер. с англ. – М.:
Издательский дом “Вильямс”, 2001. – 624 с.
3 http://www.epistemics.co.uk/Notes/37-0-0.htm
4 Осипов Г. С. Приобретение знаний интеллектуальными системами: Основы
теории и технологии. – М.: Наука. Физматлит, 1997. – 112 с.
5 Молодченков А. И. Применение программных средств PsyExp для создания
экспертных систем в области практической психологии // Интеллектуальный
анализ информации, ИАИ-2008.
Download