Платформа реализации электронных архивов данных и документов Марчук А.Г., Марчук П.А.

advertisement
Платформа реализации
электронных архивов
данных и документов
Марчук А.Г., Марчук П.А.
Институт систем информатики СО РАН,
г. Новосибирск
Что такое архив документов?
• Листы в иерархии мест расположения
(Архивы/шкафы/папки)
• Возможно, другие виды единиц хранения
• Файлы и сборки файлов - электронные
документы (медиа и документы)
Электронный архив = Электронные копии
документов + база данных + программы и
интерфейсы поддержания и публикования
Для кого предназначено
платформенное решение?
• Для разработчиков архивных систем
• Для желающих создать свой архив и
запустить его в научный оборот через
Интернет
• Для упорядочивания корпоративных или
индивидуальных массивов информации и
документов
Что из себя представляет
платформенное решение?
• База данных представляется RDF-документами
• Электронные документы и копии «бумажных»
документов размещаются в специализированных
хранилищах – кассетах
• База данных сформирована по схеме BONE –
базовой онтологии неспецифических сущностей
• Кассеты формируются и редактируются
приложением CManager
• База данных формируется и редактируется Webприложением Ursul.
• Архив данных и документов доступен для внешних
программ через Web-сервис
• Локальный архив пользователя может иметь
приватную и публичную части и также может
использовать публичную информацию других
архивов
Кассета – хранилище документов и
базы данных
• Имеет простую файл-директорную структуру,
размещает оригиналы документных файлов,
предвычисленные копии, базу данных
кассеты;
• Ключевая позиция – размещение RDF-базы
данных в хранилище в виде документов
• Имеется API работы с кассетами
RDF – как формат представления базы
данных
• Гибкий инструмент для формирования
распределенных баз данных
• Высокая степень стандартизации (URI, N3,
XML, XSD, OWL и др.)
• Имеется рекомендованный язык запросов
Sparql, имеется множество опробованных
словарей (онтологий)
• Трудность: стандарт RDF не поддерживает
полноценного редактирования базы данных.
BONE – Basic Ontology for Non-specific
Entities
семья
работа
Персона
учеба
Орг. система
отражение
авторство
отражение
Нахождение
Документ
Гео. система
отражение
Архитектура фактографической
системы
Ввод первичных
документов
Распределенная база данных
Динамическая
синхронизация
Операторы
Пользователи
Архив данных и документов как
сервис и как Web-сервис
Распределенная база данных
Клиент
-Получение информации из базы данных по идентификатору узла или
поисковому образу, добавление или изменение информации
-Получение контента документов по идентификатору, добавление
документных файлов
-Синхронизация изменений в моделях
CManager – приложение создания и
редактирования кассет
Редактирование базы данных
Шаблонные деревья
Системная организация
•
•
•
•
Публичные и специальные интерфейсы
Эволюция системы
Состав и особенности системы
Использованные технологии
Спасибо за внимание!
Related documents
Download