Интеграция информационных систем с применением семантических технологий Сергей Горшков, «Бизнес Семантика» Задача: обмен данными между приложениями • Прямой доступ в БД • Обмен через файлы (CSV, XML) • SOAP • Шины обмена сообщениями (ESB, MQ) • MDM-системы Проблема: сопоставление семантики данных в разных приложениях Что мы предлагаем? Кодировать передаваемую информацию в семантическую форму. Подлежащее – сказуемое – определение Подлежащее: универсальный идентификатор объекта (URI) Сказуемое: связь объекта с другим объектом, или название его свойства Определение: объект или литерал Возможные типы объектов, свойств, связей хранятся в онтологии Примеры стандартных онтологий: Dublin Core (DC) FOAF микроформаты (μF) Можно также создать свою онтологию – «с нуля», или путем расширения существующей. Технологии, необходимые для работы с информацией в семантической форме: RDF RDFS OWL SPARQL Обмен данными между ИС ИС - источник Данные в табличной форме (реляционная БД) клиентский компонент Преобразование данных в триплеты среда передачи Данные в семантической форме клиентский компонент Преобразование данных из триплетов ИС - приемник Данные в табличной форме (реляционная БД) Как кодируются данные? Таблица «Клиенты» ID Имя Телефон 12 Иванов 111-22-33 14 Петров 123-45-67 http://xmlns.com/foaf/0.1/#Ivanov имеет имя Иванов. http://xmlns.com/foaf/0.1/#Ivanov имеет телефон 111-22-33. http://xmlns.com/foaf/0.1/ #Ivanov имеет имя Иванов одна из стандартных онтологий уникальный ID объекта - вместе образуют URI объекта термин из онтологии (foaf:name) значение – литерал Информационный граф Таблица «Сотрудники» Таблица «Приказы» ФИО Дата Номер паспорта Номер Адрес Сотрудник … Вид приказа «Текст» в виде RDF Сотрудник #ivanov имеет имя Иванов И.И. Сотрудник #ivanov проживает по адресу ул. Мира, 1. Сотрудник #ivanov имеет паспорт с номером 65 03 111222. Приказ #0001 относится к сотруднику #ivanov. Приказ #0001 издан 2012-01-01. Приказ #0001 имеет номер 1. Приказ #0001 имеет тип прием на работу. Среда передачи ИС - источник Данные в табличной форме (реляционная БД) Какой должна быть Преобразование данных клиентский компонент среда передачи? в триплеты среда передачи Данные в семантической форме клиентский компонент Преобразование данных из триплетов ИС - приемник Данные в табличной форме (реляционная БД) • • • • Прямой доступ в БД Обмен через файлы (CSV, XML) SOAP Шины обмена сообщениями (ESB, MQ) • MDM-системы Обмен через шину ИС - источник клиентский компонент ИС - приемник SOAP - интерфейс клиентский компонент Сервер обмена сообщениями Роль клиента Генерация сообщений об изменении данных Прием и интерпретация сообщений от других систем Клиент реализует «логический уровень» - определяет правила трансформации данных. Роль сервера Маршрутизация сообщений Контроль прав доступа Восстановление целостности информации Возможно подключение SPAQRL-сервера для формирования общей аналитической базы Новизна подхода Отличие от обычной шины – реализация «логического уровня» протокола обмена. Синтез идей шины обмена сообщениями и Semantic Web Отличие от средств семантического обмена (ISO 15926) – обмен в реальном времени, возможность использования любых онтологий, реализация «логического уровня» 620075, Россия, г. Екатеринбург, ул. Бажова, д. 89 +7 (343) 2-110-220 [email protected] http://www.business-semantic.ru http://serge-index.livejournal.com