Разработка онтологических моделей для семантического поиска

advertisement
Исследование применения
онтологических моделей для
семантического поиска
Цель: определение основных способов и средств
построения онтологических моделей и выбор
специализированного языка для их описания
Актуальность
Современные средства поиска, каталогизации, описания
текстов не удовлетворяют нарастающим потребностям
пользователей. Требуется их развитие в направлении
повышения эффективности поиска информации и
упрощения взаимодействия с пользователем.
Существующие поисковые системы имеют ряд
недостатков:



избыточность - в пословном индексе используются
слова-синонимы, выражающие одни и те же понятия;
слова текста считаются независимыми друг от друга,
что не соответствует свойствам связного текста;
многозначность слов - поскольку многозначные слова
могут рассматриваться как дизъюнкция двух или
более понятий, то маловероятно, что все элементы
этой дизъюнкции интересуют пользователя.
Семантическая модель информации
• все синонимы
сведены к одному
и тому же
понятию
• многозначные
слова отнесены к
разным понятиям
• связи между
понятиями и
соответствующим
и словами
описаны
и могут быть
использованы
при анализе
текста
Диаграмма потоков данных при поиске
Под онтологией можно
понимать:
• надежный семантический базис в
определении содержания;
• общую логическую теорию,
которая состоит из словаря и
набора утверждений на некотором
языке логики;
• основу для коммуникации между
людьми и компьютерными
агентами.
Основные компоненты онтологической модели:
Концепт 1
Свойство 1
…
Свойство т
Концепт 2
Связь 1
Связь k
Свойство 1
…
Свойство n
ограничения
Концепты – понятия, классы, сущности,
категории
Свойства – слоты, атрибуты, роли
Отношения – связи, зависимости, функции
Ограничения - аксиомы
Анализ средств разработки онтологических моделей
OilEd
OntoE
dit
Ontolin
gua
OntoSa
urus
Protégé
WebODE
WebOnto
3–х
уровневая
3–х
уровнева
я
Клиент/
сервер
Клиент/
сервер
3–х
уровневая
nуровневая
Клиент/
сервер
Хранение
онтологий
файлы
файлы
файлы
файлы
файлы,
CУБД
СУБД
Язык ПО
Java
Java
Lisp
Lisp
Java
Java
Название
параметра
Архитектура
приложения
Файлы
Java+ Lisp
Осн. язык
представления
знания
DAML+OIL
OXML
Ontolingu
a
LOOM
OKBC
-
OCML
Интерфейс
пользователя
Локк-ое
приложение
Локк-ое
приложе
ние
HTML
HTML
Локк-ое
приложен
ие
HTML и
апплеты
Апплеты
-
+
-
-
+
+
+
+
-
-
-
+
+
-
Графич. редакт.
таксономии
концептов
Редактор
формальных
аксиом
Анализ форматов представления данных
Языки построения онтологий
Традиционные
языки






Ontolingu
a
CycL
LOOM
OKBC
OCML
Flogic
Более поздние
языкии,
основанные на
web-стандартах
Специальные
языки для обмена
данными через
web




XOL
SHOE
UPML


RDF(S)
DAML,OIL
OWL
График применения различных форматов при
построении онтологии
Заключение
Исходя из анализа основных параметров
различных редакторов онтологий, наиболее
приемлемым является редактор Protégé, именно
он будет взят за основу в дальнейшей работе.
Среди форматов представления данных,
лидирующие позиции занял RDF(S), который
будет использован для построения онтологии
предметной области электронной библиотеки
кафедры АСУ
Спасибо за внимание
Download