Информационная модель межведомственного взаимодействия на основе ядра данных Липунцов Юрий Московский Государственный Университет lipuntsov@econ.msu.ru План 1. Международный опыт в области межведомственного взаимодействия 2. Ядро данных для межведомственного взаимодействия 3. Примеры реализации отдельных слоев Ядра данных National Information Exchange Model США Текущее состояние: введены стандарты метаданных Система Интерфейсы коммуникаций Стандарты метаданных European Interoperability Reference Architecture European Interoperability Framework Данные из репозитория поставляются всем заинтересованным участникам Поставка данных по SPARQL Загрузка данных RDF Репозиторий базовых компонент RDF Репозиторий предметной области Общая модель данных Онтология и Таксономия предметной области Инфраструктура LOGD Infrastructure for Multilayer Interoperability (IMI) Япония Взаимодействие Основной словарь (загрузка) Словарь предметной области (загрузка) Предметно-ориентированный словарь (ссылки) Инфраструктура ЭП (Россия) текущее состояние Текущее состояние: технологическая инфраструктура СМЭВ ЕСИА ЕСНСИ Сводный реестр госуслуг Система Интерфейсы коммуникаций Инфраструктура ЭП для госуслуг Технологическое решение Информационные ресурсы Межведомственное взаимодействие на основе ядра данных Система Интерфейсы коммуникаций Инфраструктура ЭП Общее ядро Предметное ядро Предметно ориентированное ядро Сравнительный анализ международного опыта и предложений для ЭП2020 EIF NIEM IMI ЭП Предложения Тип информационной модели LAV, глобальное представление LAV, глобальное представления LAV, глобальное представления LAV, глобальное представления Уровень обмена данными Форматы данных Семантика Форматы данных Семантика Форматы данных Семантика Место хранения исходных данных Метамодель Федерация Репозиториев Репозиторий, Метамодель Репозиторий, Метамодель Технологии БД RDBMS RDF RDBMS; RDF RDBMS; RDF Степень контроля среды Контролируемая; Полу контролируемая Полу - контролируемая; Контролируемая; Полу Слабосвязанная контролируемая Контролируемая; Полу контролируемая Основное ядро; Предметные области Основное ядро; Основное ядро; Предметные области Предметные области; Предметно ориентированный словарь Основное ядро; Предметные области; Предметно ориентированный слой 2 Слои ядра 9 Ядро данных для межведомственного взаимодействия Концептуальная модель и логическая модель • Концептуальная модель – модель предметной области независимая от конкретного приложения или контекста использования данных • Логическая модель Ядра данных - модель для агрегации, хранения и представления данных поступающих из внешних источников. Модель включает Онтологическую модель и Модель интеграции данных. Онтологическая модель и Модель интеграции данных Онтология - общее представление предметной области в форме связей между сущностями. Корни графа – Базовые сущности, ветви графа являются Производными сущностями. Модель данных строится с использованием трех типов сущностей: • Базовые сущности • Сущности пересечений • Сущности хранения Базовая компонента Базовая компонента Производная базовая компонента Базовая компонента Базовые сущности и сущности пересечений Базовая сущность – основной элемент модели. Базовые сущности представляют собой отражение объектов реального мира, либо могут быть артефактами, отражающими совокупность фактов реального мира. Сущность пересечений - сущность, отражающая взаимодействие базовых компонент. Сущность пересечений может быть связана с двумя или несколькими БС. Производные базовые сущности и сущности хранения Производные базовые сущности компоненты пересечений, которые участвуют в связях как самостоятельные сущности. Сущность хранения - сущность хранения данных, поступающих из внешних источников. Сущности хранения могут создаваться как для БС, так и для СП. Базовая сущность Сущность хранения Hash Производная сущность Hash Сущность хранения Сущность пересечения Базовая сущность Сущность хранения Физическая модель 1. Принципы создания каркаса Ядра данных для взаимодействия систем Содержательный ключ (СК) : Два типа содержательных ключей – реальные (ОГРН компании), и суррогатный (Персона). В случае суррогатного СK для генерации ключа используется набор атрибутов. Вывод: все атрибуты источника данных можно поделить на две категории: – используемые для генерации СК первичных Базовых сущностей (Каркаса ядра данных) – не используемые для этого Для организации взаимодействия принципиальным является стандартизация первой категории атрибутов 2. Технические атрибуты Ядра данных для организации хранения данных Ядра используется ряд специальных атрибутов: RecordSource , Load DATESTAMP, NotActual DATESTAMP, LastSeen DATESTAMP … Примеры: Концептуальные модели Вариант универсального ядра Компания Физическое лицо Универсальное ядро Местоположение Объект недвижимости Описательное представление экспертами предметной области 15 Предметная область: высшее образование Регулирующие органы Образовательные стандарты Учащиеся Аккредитация Образовательные учреждения Высшее образование Компетенции Профессиональные стандарты Работодатели 16 Предметно - ориентированная часть университет Публикации Темы Практика Мероприятия Выпускная работа Персоны Категории Антиплагиат Учебный план Программы Ведомости Дисциплины Периоды 17 Связи между моделями Компания Физическое лицо Универсальное ядро Объект недвижимости Местоположение Регулирующие органы Учащиеся Публикации Темы Практика Мероприятия Образовательные стандарты Аккредитация Выпускная работа Персоны Категории Антиплагиат Высшее образование Профессиональные стандарты Образовательные учреждения Работодатели Учебный план Программы Ведомости Дисциплины Периоды Компетенции 18 Логическая модель: универсальное ядро Person ФИОРДРМР N_Citizenship Код Страны 3 N_СitizDoc Код документа 2 Citizen Код Гражданина Organization ОГРН Reality Кадастровый номер Location Код адреса Reality Location Organization Person Citizenship RealityLocation OrgLocation OrgFounder PersonCitiz Doc Role CitizLocation Citizen RealHolders 19 Логическая модель: онтология обучения (университет) Элементы для стандартизации Набор 1 поз Набор прог. 3 поз Элементы общего ядра Программа - 2 поз Студ.гр 6 поз Элементы ядра предметной области Студент 10 поз Элементы предметноориентированного ядра Группа 3 поз Персоны - 4 поз Подразделение 2 поз Сотрудники 6 поз Дисциплина 3 поз Курс Период 1 поз Ведомость 9 поз Эл.курс 15 поз Поток 15 поз Тип занятий 1 поз Номер потока 1 поз Занятие 22 поз Пара 1 поз Дата 1 поз Аудитория 2 поз Тип ресурса 1 поз Ресурс 18 поз Логический уровень: Модель интеграции данных (университет) BunchDate TeacherBunch Pair Date StudentBunch Room Lesson Bunch Parent Bunch CourseLtype ResourseType Lcourse LessonResourse Ltype Dtype CourseRtype NBunch PersonDep EnrSubj Resourse Department Course Subject Person Period StudentMark StudentGroup MarkSeet Marksheet Enrol Program ProgCoh Cohort Group SylGroup Stgroup StudentScore Базовые Базовые сущности СущностиПересечений Сущности пересечений Производные Базовые Сущности Физическая модель: универсальное ядро Единый PersonID на весь период времени, независимо от изменения FamilyName. Атрибут для генерации СK FamilyNameOnBirth PersonGUID 7D2BA7DE.. 7D2BA7DE.. 7D2BA7DE.. PersonBK РЕВИНАЕЛЕ.. РЕВИНАЕЛЕ.. РЕВИНАЕЛЕ.. LoadDST 18.01.2006 19.07.2012 24.06.2015 NADST 19.07.2012 24.06.2015 RSRC ZAGS34 ZAGS34 ZAGS34 DataHash 776A415.. 1F1B072.. 7D2BA7D.. FamilyName РЕВИНА ЗАЧЕСОВА РЕШЕТНИКОВA FirstName ЕЛЕНА ЕЛЕНА ЕЛЕНА Справочник документов UlgUID LDST RSRC 616B.. 23.11.2015 3AF6.. 7ED7.. NADST UlgBK Name MNS45 1 Паспорт СССР 23.11.2015 MNS45 21 Паспорт России 23.11.2015 MNS45 22 Заграничный паспорт России Различные документы гражданина, отдельные из которых неактуальны (NADST) CitizUID 73A3.. B6B3.. B6B3.. 9CD9.. PersonGUID 7D2B.. 7D2B.. 7D2B.. 7D2B.. UlgUID 616B.. 3AF6.. 3AF6.. 7ED7.. StUID 9380.. BFFA.. BFFA.. BFFA.. LDST RSRC 23.11.2015 PAS77 23.11.2015 PAS77 23.11.2015 PAS77 23.11.2015 PAS77 NADST DocSerNum DataHash 18.01.1999 09МЮ681111 B643.. 18.11.2006 4500991111 198CD.. 4599961111 35D3.. 1501361111 AD96.. BFamName РЕВИНА РЕВИНА РЕВИНА Физическая модель: интегрированные данные университета Глубокий содержательный ключ предоставляет широкие возможности для потребителей данных PrimaryKey EDD… F84… 1C2… EC6… 09C… 33F… E53… B63… 3E5… C02… A62… Направление BunchBK B.M.3.5.FRI.OD.FK.L.CHTN.0 B.M.3.5.FRI.OD.FI.L.CHTN.0 B.E.3.5.BUK.OD.UA.C.LYDV.6 E.F.4.4.NTT.PS.EU.S.TYVP.0 B.E.4.3.TOC.DR.PE.S.SODB.1 B.E.4.3.GPH.DR.YF.L.SITE.0 B.E.3.5.NYG.FO.SN.S.KUIN.0 B.E.3.5.NYG.FO.SN.C.KUIN.0 B.E.3.5.KMY.DX.MM.L.KRVV.0 B.E.4.3.LOG.OD.MM.C.ROYA.4 B.F.1.9.MBC.DY.MK.Z.CHAV.0 Программа Период Subj Финансовые рынк.. Финансовые рынк.. Бухгалтерский у.. Научный семинар.. Теория обществе.. Гражданское пра.. Немецкий язык б.. Немецкий язык б.. Количественные .. Логика.. Маркетинг.. Предмет Tsubj Общие дисциплин.. Общие дисциплин.. Общие дисциплин.. ПРОФЕССОРСКИЕ С.. Дисциплины по в.. Дисциплины по в.. Фак-вы[фАЯс+фНЯ.. Фак-вы[фАЯс+фНЯ.. Дисциплины по в.. Общие дисциплин.. Дисциплины по в.. Преподаватель Концепция методологии систематизации и кодирования информации, а также совершенствования и актуализации общероссийских классификаторов, реестров и информационных ресурсов. Утверждена распоряжением Правительства РФ от 10 мая 2014 г. N 793-р (КСКИ). Вопросы?