Программные продукты для построения онтологий: DOE и Protégé

реклама
Константинова Наталья
Актуальность
• На данном этапе существования компьютерных
технологий и техники, с развитием наукоемких
областей все быстрее растет объем
информации.
• Появилась необходимость создания
всеобъемлющих баз знаний, автоматической
обработки информации.
• Возрастает интерес к формальным онтологиям
как эффективному средству представления
знаний.
Semantic Web (2001)
• Все чаще можно услышать о Semantic
Web (2001)
• Надстройка над WWW, страницам
сайта приписано некоторое
формальное семантическое описание
• Онтология это средство для описания
смысла и связи понятий.
Онтология: 2 значения
• Философская дисциплина изучает
наиболее общие характеристики бытия
и сущностей
• Онтология – артефакт, структура,
описывающая значения элементов
некоторой системы
Онтология (артефакт)
• Неформально, онтология представляет
собой некоторое описание взгляда на
мир применительно к конкретной
области интересов.
• Это описание состоит из терминов и
правил использования этих терминов,
ограничивающих их значения в рамках
конкретной области
Определение онтологии
• На формальном уровне, под
онтологией понимается:
- система понятий некоторой
предметной области, которая
представляется как набор сущностей,
соединенных различными
отношениями.
Структура онтологии
Если Х смертен, то Х когда-нибудь умрет.
часть-целое ; родовидовые
Человек ; Животное
Королева Виктория, Платон,
Евгений Плющенко
Аксиомы
Отношения
Понятия
Отдельные экземпляры
Общие сведения
• Преимущество - формальная
структура, делающая возможным их
простую компьютерную обработку
• Это достаточно новая область
(исследования с конца 90х годов)
• Однако уже сейчас создан ряд больших
онтологий, включающих несколько
тысяч понятий (OMEGA, SUMO, DOLCE
и др.)
Где можно применять
онтологии
•
•
•
•
•
искусственный интеллект;
информационный поиск;
вопросно-ответные системы;
машинный перевод;
системы понимания языка
(аннотирование текста, реферирование,
проверка непротиворечивости текста и
т.д.)
Языки представления
• Изначально - основным языком описания
онтологий являлся XML.
• Затем развивалось множество языков
формального представления (напр. SHOE, OIL,
DAML, DAML+OIL и др.).
• В 2004 году члены World Wide Web Consortium
(W3C) рекомендовали использование
универсального стандарта для сетевого обмена
онтологической информацией – Web Ontology
Language (OWL), а также RDF (Resource Data
Framework).
Редакторы онтологий
Сейчас существует множество
коммерческих или же свободно
распространяемых программных
продуктов для создания и
редактирования онтологий.
Однако мы затронем лишь два из
них: DOE и Protégé.
Выбор редактора
Во многом оценка функциональности
программ для построения онтологий
зависит от:
• практической задачи (целей
разработчика)
• области знания, в рамках которой
строится онтология
• разрабатываемой онтологии
Специфика онтологии
• В нашем случае строилась онтология
подобласти финансового
менеджмента,
• одной из особенностей которой было
отсутствие конкретных экземпляров;
• наличие многообразия отношений, а
не только родовидовых.
Экспорт
• Для онтологии важна простота ее переноса
на другие платформы и внедрения в другие
программные продукты и онтологии,
переводимость на другие формальные
языки:
 DOE – предоставляет экспорт в RDFS; OWL
presentation syntax; OWL exchange syntax; OIL
plain text; OIL XML; DAML+OIL; CGXML.
 Protégé – экспорт в RDF; RDFS; XML; HTML;
OWL; Clips; N3; TURTLE.
Специфика структуры редакторов DOE
В Doe присутствуют:
• класс
• свойство
- домен
• Разбиение на дифференциальную часть и
референциальную. Д. – манипулирует на
уровне понятий, а Р – на уровне конкретных
экземпляров. В каждой части отдельно
строятся иерархии понятий/экземпляров и
отношений
Специфика структуры редакторов
- Protégé
В Protégé присутствуют:
• классы
• слоты (=свойство)
• экземпляры
• фасеты (= ограничения слотов)
Как создать онтологию
• Выделение понятий
• Формулирование отношений между
понятиями
• Пополнение онтологии конкретными
экземплярами
• Формулировка аксиом
• Переходя от одного элемента онтологии к
другому, продемонстрируем специфику
сравниваемых редакторов
Отражение классов - DOE
Отражение классов - DOE
• удобен метод выявления оснований для
деления (присутствуют такие поля, как
сходство и различия с родительским классом и
с братьями) – помогает формализовать
выделение классов;
• однако избыточны генерируемые определения
(они генерируются автоматически на основе
сходства с братьями и различия с братьями);
• встроены синонимы и лексические
предпочтения;
• нет поддержки русского языка для
представления.
Отражение классов - Protégé
Отражение классов - Protégé
• есть возможность описания метаклассов
(«шаблонов» для классов)
• поддерживается множественное
наследование;
• предоставляется выбор типа представления
классов. Можно указать, как хочешь видеть
класс, какие описания туда включить.
• нет встроенных синонимов. Их надо задавать
отдельно при помощи слота.
Отражение отношений - DOE
Отражение отношений - DOE
• позволяет строить иерархии
отношений
• но нет привязки к классам или
экземплярам (возможна лишь путем
установки домена для отношения)
• однако неясно, как задавать
отношения отличные от родовидовых,
напр.часть-целое
Отражение отношений - Protégé
Отражение отношений - Protégé
• возможность создавать и широко
описывать новые отношения в
дополнение к стандартным. Список
стандартных также велик.
• Кроме того, существует возможность
связывать отдельные классы или
экземпляры посредством различных
отношений. То есть – наглядность!
Отражение отношений - Protégé
• есть фасеты – ограничения на
отношениях – мощность, домен,
диапазон и др.
• также есть установка отношений между
самими слотами – напр.:
owl:equivalentProperty (определяет
эквивалентное свойство) и owl:inverseOf
(определяет обратное свойство)
Работа с конкретными экземплярами DOE
Работа с конкретными экземплярами DOE
• очень просто создавать экземпляры
• но нельзя их напрямую описывать
при помощи отношений и свойств
Работа с конкретными экземплярами Protégé
Работа с конкретными экземплярами Protégé
• много возможностей для приписывания
конкретных свойств отдельному
экземпляру
• можно связывать отношением
конкретный экземпляр и класс
• можно задавать формы представления
экземпляров.
Аксиомы
• DOE – не поддерживаются;
• Protégé:
существует как дополнительная
опция
Protégé - запросы
• Возможно использование сложных
запросов для поиска в рамках
онтологии.
• Можно осуществлять выборку
информации, проверку и т.д.
Protégé - запросы
Выводы
• DOE проще в использовании
• Protégé сложнее, но предоставляет
больше возможностей для адаптации
под конкретную задачу и конкретного
пользователя.
???Вопросы???
Скачать