Шалфеева Е.А.Единый подход к определению структурных

advertisement
УДК 004.8
ЕДИНЫЙ ПОДХОД К ОПРЕДЕЛЕНИЮ
СТРУКТУРНЫХ СВОЙСТВ ОНТОЛОГИЙ *
Е.А. Шалфеева1
Использование онтологий в сфере искусственного интеллекта
связано с необходимостью оценивания свойств онтологий. Единый
подход обеспечивает возможность однозначно определять важные
структурные свойства и дефекты онтологий, которые влияют на
свойства интеллектуальных систем, создаваемых с использованием
онтологий. В статье представлен подход к определению
структурных свойств для объективного оценивания «широкого
спектра» онтологий.
Введение
В современных проектах по созданию и эффективному
использованию
распределенных
широкомасштабных
библиотек
многократно используемых онтологий большое внимание уделяется
качеству онтологий, а в литературе описан ряд свойств различных
онтологий и некоторые способы их измерения. Известными
специалистами, обращающимися к проблеме
исследования свойств
онтологий и близких к онтологиям моделей, являются Assenova P. &
Johannesson P., Colomb R.M., Garigue R., Gomez-Perez A., Gruber T.R.,
Teeuw W.B. & van den Berg H. и др.
Многообразие свойств онтологий, различия в списках свойств
онтологий и концептуальных моделей естественно вынуждают
классифицировать свойства в зависимости от стоящих перед
исследователем целей. Известны разные подходы к классификации,
которые, тем не менее, на практике не слишком облегчают выбор
подходящих свойств для оценивания произвольной онтологии [ Assenova
Работа выполняется при финансовой поддержке ДВО РАН в рамках
Программы №14 Президиума РАН, проект "Интеллектуальные системы,
основанные на многоуровневых моделях предметных областей" и
при
финансовой поддержке РФФИ, проект «Исследование возможностей
коллективного управления в Семантическом вебе информационными ресурсами
различных уровней общности».
1 ИАПУ ДВО РАН, 690041, г. Владивосток, ул. Радио, 5., shalf@iacp.dvo.ru
*
etc, 1996, Colomb, 2002, Sinderen, 1995, Lindland, 1994].
Для того чтобы обеспечить систематический подход к исследованию
свойств онтологий, разработана «универсальная» классификация свойств
[Шалфеева, 2005]. В ней свойства произвольных онтологий разбиты на
две категории: 1) определяемые при использовании и 2) определяемые при
создании
онтологий. В каждой из категорий имеется дальнейшее
«разбиение на группы». Свойства первой категории обнаруживаются и
определяются по отношению к «моделируемой области», а второй безотносительно к «области».
К свойствам, определяемым при использовании онтологий, отнесены
«свойства, относящиеся к функциональности онтологии», т.е. к
тому, какие аспекты моделируемой области выражаются с
помощью понятий [Teeuw et al, 1997, Assenova et al, 1996], и
«свойства, относящиеся к легкости использования онтологии», т.е.
к тому, как эти аспекты моделируемой области выражены с
помощью понятий [Teeuw et al., 1997, Lindland, 1994].
Свойства, определяемые при создании онтологий могут быть
объективно измерены при наличии однозначно
сформулированных
определений. В универсальной классификации они имеют такие
подкатегории как свойства, относящиеся к архитектуре онтологии,
свойства определений и свойства онтологического соглашения, а также
свойства структуры отношений в онтологии.
Базовые термины для однозначного определения различных групп
свойств этой категории [Шалфеева, 2005], обусловленных практикой
оценивания онтологий разных предметных областей, разных уровней
общности и написанных на разных языках1, будут ниже представлены.
1. Базовые термины для свойств, относящихся к архитектуре
онтологии
Свойства этой категории важны при создании многомодульных
онтологий, при повторном использовании готовых модулей для создания
новой онтологии, при интегрировании онтологий.
Для создания однозначно понимаемых определений свойств,
представляющих интерес для оценивания, предлагается использовать
следующие базовые термины: граф использования модулей онтологии и
граф включения модулей онтологии.
Граф включения модулей онтологии – графовая модель <В, Д>,
где вершины В = {Вi}, Вi соответствует модулю онтологии,
1
Исследовались свойства онтологий, написанных на языках OWL, Oil, kif, «языке
математики», языке прикладной логики.
а Д = {Дj}, дугами - связи типа «включает», семантика их такова –
определяемый модуль включает один или несколько ранее
определенных модулей, т.е. все определяемые понятия из
включаемых модулей добавляются к понятиям включающего
модуля2.
Среди свойств онтологии, рассматриваемой как совокупность
модулей могут быть оценены (а значит, требуют точных определений)
такие как модульность, число связей использования между парой модулей,
наличие цикличных включений и др. свойства.
Например: модульность (modularity) – наличие более одной
вершины (модуля) в графе включения модулей онтологии (или в
графе использования модулей онтологии).
Среди свойств одного модуля в совокупности (или иерархии) модулей
могут быть оценены включающие модули, включаемые модули, включение
модуля, содержащего специализируемое понятие; фактическое
использование понятий из используемых модулей, включаемые модули, из
которых не используется явно ни одно понятие, не включаемые модули, из
которых все же используются сущности, наличие неопределенных
сущностей, сцепление пары модулей.
Например: включающие модули - число дуг-связей «включает»,
входящих в вершину (соответствующую оцениваемому модулю) в
графе включения модулей онтологии.
2. Базовые термины для свойств структуры отношений в
онтологии
Свойства этой категории важны для оценивания и сопоставления
классификаций терминов, для оценивания степени «проработанности»
моделируемых предметных областей, для поиска структурных дефектов
онтологий, для оценивания структурной сложности онтологий разных
уровней общности и разных предметных областей, для сравнения и
сопоставления особенностей онтологий предметных областей и выявления
типичных видов связей между понятиями в онтологиях разных
предметных областей.
2.1. Свойства однородной структуры
Среди свойств однородной структуры чаще других рассматривают
свойства таксономии, для которых в рамках единого подхода к
оцениванию предложены следующие базовые термины: граф таксономии
2
Анализ включения особенно важен для многоуровневых онтологий.
сущностей [модуля] онтологии и граф таксономии связей [модуля]
онтологии.
Граф таксономии сущностей [модуля] онтологии – графовая
модель <В, Д>,
где вершины В = {в-i}, в-i соответствует сущности (классу
сущностей) [модуля] онтологии,
а дуги Д = {д-j}, д-j – связи двух видов: «является представителем»
и «является потомком».
Граф таксономии связей [модуля] онтологии – графовая модель
<В, Д>,
где вершины В = {в-i}, в-i - связи (отношения, функции, атрибуты),
а дуги Д = {д-j}, д-j – связи двух видов: «является представителем»
и «является потомком» (между отношениями, предикатами).
Примерами таксономических свойств являются размер таксономии,
размер набора листовых вершин, число связных компонентов графа
таксономии, глубина модели иерархии, ширина дерева понятий, общее
количество отношений,
количество созданных экземпляров,
«перекрываемость подклассов» или наличие понятий с несколькими, число
корневых классов, отсутствие циклов в модели наследования, число
переопределений понятия, наличие потомка у некоторой сущности, не
обладающего никакими особенностями, некорректность области
опредеения\значений, неполнота области определения\значений, наличие
неявных подклассов, наличие избыточности при определении подклассов,
наличие избыточности при определении представителя.
Пример определения: размер таксономии модуля – число вершин в
графе таксономии сущностей модуля онтологии, в которые входят
дуги «является потомком» «плюс» число вершин в
графе
таксономии связей, в которые входят дуги «является потомком».
Пример
вычисления свойств.
Без имени (1)
Без имени (2)
Без имени (3)
Для
отнологии
Author
компьютерных игр,
доступной
через
ComputerGame
Интернет (созданной
Company
…
с
помощью
StrategyGame
«Protégé», with OWL
…
…
Plugin 1.2, Build
WarStrategyGame
MicroProse
…
161), строится граф
A3DO
таксономии
TurnBasedStrategyGame …
…
сущностей
(внутреннее
…
представление
«Ascendancy»
«Civilization2»
Рис. 1 Фрагмент графа таксономии сущностей для онтологии «Games»
онтологии), его фрагмент – на рисунке 1.
Следующие свойства могут быть вычислены в терминах этих графов:
глубина дерева понятий (на фрагменте графа - 4), глубина таксономии
(вместе с экземплярами) (на фрагменте графа – 5) и другие свойства.
Для «свойств партономии» [Шалфеева, 2006] определяются базовые
термины: граф партономии [модуля] онтологии (определяется, возможно,
с использованием базового термина граф таксономии связей).
граф партономии [модуля] онтологии – графовая модель
<В, Д>,
где вершины В = {в-i}, в-i - сущности (классы сущностей)
[модуля] онтологии,
а дуги Д = {д-j}, д-j – связи следующих видов: является
последовательностью,
является
множеством,
является объединением множеств, является одним из.
Среди свойств онтологии могут быть оценены и определены в
базовых терминах такие свойства, как размер партономии, глубина
партономических
связей,
«перекрываемость
частей»,
Число
компонентов, связанных с данной сущностью связями «часть- целое»
разного вида, наличие циклической связи «часть-целое», число разных
видов связей, относящихся к категории «целое-часть».
Например: число разных видов связей, относящихся к категории
«целое-часть» - число разных видов дуг в графе партономии
[модуля] онтологии.
Для свойств отношений причинности определяется граф причинноследственных связей [модуля] онтологии, а для свойств структуры
пространственных отношений - граф пространственных связей [модуля]
онтологии.
Для свойств структуры ролевых отношений определяется граф
ролевых связей [модуля] онтологии (используются ранее определенные
базовые термины граф таксономии сущностей [модуля] онтологии и граф
таксономии связей онтологии).
Граф ролевых связей [модуля] онтологии – графовая модель <В,
Д>,
где вершины В = {в-i}, в-i - сущности – активности
(деятельности) онтологии [Madsen, 2002], в частности
определяемые в онтологии потомки сущности «действие
(act)» и потомки сущности «процесс», а также другие
сущности (классы сущностей) онтологии, связанные с этими
«ролевыми» связями (см. ниже),
а дуги Д = {д-j}, д-j – «ролевая» связь между сущностями, одного
из видов: связь с инструментом, связь с так называемым
агентом (тем, кто осуществляет действие), связь с
результатом (result) или с целью, связь с так называемым
субъектом (patient). При этом дуги имеют метку,
содержащую название ролевой связи.
Для оценивания представляют интерес такие свойства как полнота
связей «деятельности» с «агентом», «субъектом», «инструментом» и
ожидаемым «результатом»; отсутствие для вершины–активности
одного\двух\трех видов ролевых связей; наличие «потенциально
посторонних» связей для рассматриваемой сущности-деятельности
(например, между агентом и субъектом).
Пример определения: полнота связей деятельности с агентом,
субъектом, инструментом и ожидаемым результатом – наличие
для сущности-активности (деятельности) в графе ролевых связей
модуля онтологии дуг всех четырех видов: связь с инструментом,
связь с агентом, связь с результатом, связь с субъектом.
Для онтологий, в которых трудно вычленить специфические связи ролевые, простанственные и т.п., разумно определять свойства
структуры предметно-ориентированных связей по графу предметноориентированных связей [модуля] онтологии:
граф предметно-ориентированных связей [модуля] онтологии –
графовая модель <В, Д>,
где вершины В = {в-i}, в-i - сущности (классы сущностей) [модуля]
онтологии (двух видов – сущность и экземпляр),
а дуги Д = {д-j}, д-j – связи, отличные от таксономических,
партономических и теоретико-множественных, имеющие
метку с названием связи.
Пример вычисления
publicationYear
свойств. Для отнологии
Без имени (1)
не определено
компьютерных
игр
runsOnPlatfor
Без имени (2)
не определено
m
строится
граф
hasAuthor
Без имени (3)
не определено
предметноориентированных связей
онтологии,
фрагмент
«PC»
runsOnPlatform
которого - на рисунке 2.
runsOnPlatform
hasAuthor
«Ascendancy»
В терминах графа
«BroadBund»
предметноrunsOnPlatfor
hasAuthor
«SidMeyer»
m
ориентированных связей
hasAuthor
«Civilization2»
вычисляется
свойство
«Microprose»
наличие
вершины,
hasRequirements
hasRequirements
«отправляющей»
«VGACard_SBlaster»
одинаковые дуги разным
вершинам (значение – Рис. 2 Граф предметно-ориентированных связей онтологии «Games»
«да», такая вершина есть: экземпляр «Civilization2» имеет две дуги
hasAuthor к вершинам «SidMeyer» и «Microprose»).
2.2. «Совместные» структурные свойства двух и более видов
структуры
На основе вышеопределенных базовых терминов могут быть даны
определения «совместных свойств таксономии и партономии» или
другой структурной модели. Примеры совместных свойств таксономии и
некоторой «предметно-ориентированной» структуры - отсутствие
избыточности в свойствах или поведении сущности, связи (нетаксономической) между двумя сущностями, более абстрактной, чем связь
между их предками, «полезность» множества свойств сущности,
согласованность кардинальности
некоторой топологической связи,
указываемой и для предка, и для потомка, неудовлетворительная
характеристика непересекаемости понятий верхнего уровня, наличие
признаков «неудовлетворительной классификации», наличие признаков
несогласованности определений, наличие специфических знаний о классах.
Пример определения: отсутствие избыточности в свойствах или
поведении сущности-потомка – наличие двух вершин, связанных
путем в графе таксономии и имеющих одинаковую дугу с
некоторой третьей вершиной в графе с не-таксономической
структурой.
Пример вычисления свойств. Для отнологии компьютерных игр
«совместные» структурные свойства двух видов структуры: Наличие
признаков «неудовлетворительной классификации» - наличие одинаковых
уточнений диапазонов атрибутов либо связей для
всех потомков
сущности – (значение «да», для
всех представителей сущности
TurnBasedStrategyGame; наличие «листовых» сущностей таксономии,
которые нигде не использованы – «да» (введен экземпляр A3DO, но нигде
не использован).
Выводы: Наличие одинаковых значений атрибута runsOnPlatform и
одинаковых уточнений диапазонов атрибута hasRequirements для всех
представителей сущности TurnBasedStrategyGame в соответствии с
[Gomez-Perez, 2001] означает неудовлетворительную классификацию.
Возможные рекомендации таковы:
либо изменить классификацию, чтобы уточнить значения свойств
runsOnPlatform и hasRequirements натуровне дополнительного подкласса;
либо вынести часть информации в отдельный модуль, т.е. отделить
информацию, в которой описаны знания о конкретных представителях
сущности TurnBasedStrategyGame (и других представителях других
сущностей с одинаковыми значениями свойств) от собственно онтологии
таких знаний.
3. Базовые термины для свойств определений и
онтологических соглашений
Свойства этой категории важны для контроля достаточности и
неизбыточности множества определяемых терминов (понятий),
согласованности употребляемых терминов, сопоставления формальных и
неформальных частей определений.
Для создания однозначно понимаемых определений свойств
взаимосвязи терминов предложен базовый термин граф связей
определяемых понятий.
Для создания однозначно понимаемых определений свойств
определений сущностей (в рамках совокупности определений) предложен
базовый термин совокупность структурных определений сущностей
{<оCущ-i>}. Аналогично рассматриваются и свойства определений связей
(функций, предикатов, отношений) {<оСвз-j>}.
Для создания однозначно понимаемых определений свойств
совокупности определений и онтологических соглашений предложен
базовый термин совокупность определений терминов и соглашений
онтологии (или одного модуля) – множество структурных определений
сущностей «плюс» множество структурных определений связей «плюс»
множество простых структур онто-соглашений - {<оCущ-i>} U {<оСвзj>} U {<оСогл-k>}.
Заключение
Единый подход к определению структурных свойств онтологий
предназначен для систематического оценивания онтологий на практике.
Известные структурные свойства в рамках такого подхода являются
объективно измеряемыми, для них предложены однозначно толкуемые
определения. Оценивание «внутренних» свойств в случае однозначного и
языково-независимого их определения становится объективным (и может
быть автоматизировано). Рассмотрение структуры модели онтологии с
нескольких точек зрения: с точки зрения иерархии сущностей, с точки
зрения связей часть-целое, с точки зрения ролевых связей и т.п., дает
возможность формулировать ряд свойств онтологии в
языковонезависимых терминах, что позволяет сравнивать свойства разных
моделей одной и той же онтологии.
Список литературы
[Assenova et al., 1996] Assenova P., Johannesson P. Improving quality in Conceptual
Modelling
by
the
use
of
schema
transformations.
pdf,
1996.
http://www.dsv.su.se/~petia/Publications/kval.pdf
[Colomb, 2002] Colomb R.M. Quality of ontologies in Interoperating Informational
Systems, Technical Report 18/02 ISIB CNR Italy, 2002. http://www.loacnr.it/Papers/ISIB-CNR-TR-18-02.pdf.
[Gomez-Perez, 1995] Gomez-Perez A. Criteria to Verify Knowledge Sharing
Technology. Knowledge Systems Laboratory, January, 1995. http://wwwksl.stanford.edu/KSL_Abstracts/KSL-95-10.html
[Gomez-Perez, 2001] Gomez-Perez A. Evaluation of ontologies. International Journal
of intelligent systems, 16, 2001.
[Lindland, 1994] Lindland O.I. et al. Understanding Quality in Conceptual Modeling //
IEEE Software, 11(2), March 1994.
[Madsen, 2002] Madsen B.N., Pedersen B. S. & Thomsen H.E. "Semantic Relations in
Content-based Querying Systems: a Research Presentation from the OntoQuery
Project". In: K. Simov and A. Kiryakov (Eds.): Ontologies and Lexical Knowledge
Bases. Proceedings of the 1st International Workshop, OntoLex 2000. OntoText
Lab., Sofia 2002.
[Rozman et al., 1999] Rozman I., Welzer T. et al. Reusable conceptual models as a
support for the higher information quality. http://dbtlab.uni-mb.si/tatjana/icpqr99.pdf
[Sinderen, 1995] van Sinderen M.J. On the design of application protocols, Ph.D.
Thesis, University of Twente, Enschede, The Netherlands, 1995.
[Teeuw et al., 1997] Teeuw W.B., van den Berg H. On the Quality of Conceptual
Models // Proceedings of the ER'97 workshop on behavioral models and design
transformations: Issues and opportunities in conceptual modeling / Ed. by Liddle S.
W.
Los
Angeles,
CA,
USA,
November
6-7,
1997.
http://osm7.cs.byu.edu/ER97/workshop4/tvdb.html.
[Шалфеева, 2005] Шалфеева Е.А. Классификация свойств онтологий. Свойства
онтологий и их классификации // Научно-техническая информация, серия 2,
2005, No 11.
[Шалфеева, 2006] Шалфеева Е.А. Классификация свойств онтологий. Наполнение
универсальной классификации однозначно понимаемыми свойствами //
Научно-техническая информация, серия 2, 2006, No 1.
Download