Константинова Наталья Актуальность • На данном этапе существования компьютерных технологий и техники, с развитием наукоемких областей все быстрее растет объем информации. • Появилась необходимость создания всеобъемлющих баз знаний, автоматической обработки информации. • Возрастает интерес к формальным онтологиям как эффективному средству представления знаний. Semantic Web (2001) • Все чаще можно услышать о Semantic Web (2001) • Надстройка над WWW, страницам сайта приписано некоторое формальное семантическое описание • Онтология это средство для описания смысла и связи понятий. Онтология: 2 значения • Философская дисциплина изучает наиболее общие характеристики бытия и сущностей • Онтология – артефакт, структура, описывающая значения элементов некоторой системы Онтология (артефакт) • Неформально, онтология представляет собой некоторое описание взгляда на мир применительно к конкретной области интересов. • Это описание состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области Определение онтологии • На формальном уровне, под онтологией понимается: - система понятий некоторой предметной области, которая представляется как набор сущностей, соединенных различными отношениями. Структура онтологии Если Х смертен, то Х когда-нибудь умрет. часть-целое ; родовидовые Человек ; Животное Королева Виктория, Платон, Евгений Плющенко Аксиомы Отношения Понятия Отдельные экземпляры Общие сведения • Преимущество - формальная структура, делающая возможным их простую компьютерную обработку • Это достаточно новая область (исследования с конца 90х годов) • Однако уже сейчас создан ряд больших онтологий, включающих несколько тысяч понятий (OMEGA, SUMO, DOLCE и др.) Где можно применять онтологии • • • • • искусственный интеллект; информационный поиск; вопросно-ответные системы; машинный перевод; системы понимания языка (аннотирование текста, реферирование, проверка непротиворечивости текста и т.д.) Языки представления • Изначально - основным языком описания онтологий являлся XML. • Затем развивалось множество языков формального представления (напр. SHOE, OIL, DAML, DAML+OIL и др.). • В 2004 году члены World Wide Web Consortium (W3C) рекомендовали использование универсального стандарта для сетевого обмена онтологической информацией – Web Ontology Language (OWL), а также RDF (Resource Data Framework). Редакторы онтологий Сейчас существует множество коммерческих или же свободно распространяемых программных продуктов для создания и редактирования онтологий. Однако мы затронем лишь два из них: DOE и Protégé. Выбор редактора Во многом оценка функциональности программ для построения онтологий зависит от: • практической задачи (целей разработчика) • области знания, в рамках которой строится онтология • разрабатываемой онтологии Специфика онтологии • В нашем случае строилась онтология подобласти финансового менеджмента, • одной из особенностей которой было отсутствие конкретных экземпляров; • наличие многообразия отношений, а не только родовидовых. Экспорт • Для онтологии важна простота ее переноса на другие платформы и внедрения в другие программные продукты и онтологии, переводимость на другие формальные языки: DOE – предоставляет экспорт в RDFS; OWL presentation syntax; OWL exchange syntax; OIL plain text; OIL XML; DAML+OIL; CGXML. Protégé – экспорт в RDF; RDFS; XML; HTML; OWL; Clips; N3; TURTLE. Специфика структуры редакторов DOE В Doe присутствуют: • класс • свойство - домен • Разбиение на дифференциальную часть и референциальную. Д. – манипулирует на уровне понятий, а Р – на уровне конкретных экземпляров. В каждой части отдельно строятся иерархии понятий/экземпляров и отношений Специфика структуры редакторов - Protégé В Protégé присутствуют: • классы • слоты (=свойство) • экземпляры • фасеты (= ограничения слотов) Как создать онтологию • Выделение понятий • Формулирование отношений между понятиями • Пополнение онтологии конкретными экземплярами • Формулировка аксиом • Переходя от одного элемента онтологии к другому, продемонстрируем специфику сравниваемых редакторов Отражение классов - DOE Отражение классов - DOE • удобен метод выявления оснований для деления (присутствуют такие поля, как сходство и различия с родительским классом и с братьями) – помогает формализовать выделение классов; • однако избыточны генерируемые определения (они генерируются автоматически на основе сходства с братьями и различия с братьями); • встроены синонимы и лексические предпочтения; • нет поддержки русского языка для представления. Отражение классов - Protégé Отражение классов - Protégé • есть возможность описания метаклассов («шаблонов» для классов) • поддерживается множественное наследование; • предоставляется выбор типа представления классов. Можно указать, как хочешь видеть класс, какие описания туда включить. • нет встроенных синонимов. Их надо задавать отдельно при помощи слота. Отражение отношений - DOE Отражение отношений - DOE • позволяет строить иерархии отношений • но нет привязки к классам или экземплярам (возможна лишь путем установки домена для отношения) • однако неясно, как задавать отношения отличные от родовидовых, напр.часть-целое Отражение отношений - Protégé Отражение отношений - Protégé • возможность создавать и широко описывать новые отношения в дополнение к стандартным. Список стандартных также велик. • Кроме того, существует возможность связывать отдельные классы или экземпляры посредством различных отношений. То есть – наглядность! Отражение отношений - Protégé • есть фасеты – ограничения на отношениях – мощность, домен, диапазон и др. • также есть установка отношений между самими слотами – напр.: owl:equivalentProperty (определяет эквивалентное свойство) и owl:inverseOf (определяет обратное свойство) Работа с конкретными экземплярами DOE Работа с конкретными экземплярами DOE • очень просто создавать экземпляры • но нельзя их напрямую описывать при помощи отношений и свойств Работа с конкретными экземплярами Protégé Работа с конкретными экземплярами Protégé • много возможностей для приписывания конкретных свойств отдельному экземпляру • можно связывать отношением конкретный экземпляр и класс • можно задавать формы представления экземпляров. Аксиомы • DOE – не поддерживаются; • Protégé: существует как дополнительная опция Protégé - запросы • Возможно использование сложных запросов для поиска в рамках онтологии. • Можно осуществлять выборку информации, проверку и т.д. Protégé - запросы Выводы • DOE проще в использовании • Protégé сложнее, но предоставляет больше возможностей для адаптации под конкретную задачу и конкретного пользователя. ???Вопросы???