Долговременное хранение цифровых документов Тема 12 В чем проблема сохранности цифровых материалов? (из доклада Барбары Сирмен) Электронные документы создаются с помощью специальных программных средств и предназначены для использования в определенной программно-аппаратной среде. Это весьма осложняет проблему их сохранности. Коммерческие фирмы разрабатывают новые программно-аппаратные средства, а средства предыдущего поколения перестают использоваться. Доступ к объектам, созданным с помощью средств прежних поколений, может быть утрачен, если не будут приняты соответствующие меры. Вопрос долгосрочной сохранности – это прежде всего разработка таких мер. Сегодня практически каждое учреждение имеет свой сайт или электронный архив. Объемы информации, подлежащей хранению, постоянно растут. Чрезвычайно важна кооперация, так как проблема выходит за рамки возможностей одной организации. Массивы электронных документов в национальных библиотеках Проекты оцифровки, отдельные примеры: Великобритания: 100000 книг свободных от копирайта будут в ближайшее время оцифрованы В Нидерландах планируется оцифровка 8 млн страниц газет Проект Gallica в национальной библиотеке Франции В Чехии уже оцифровано несколько млн листов старопечатных книг и рукописей Массивы электронных документов в национальных библиотеках Документы созданные в электронной форме: Электронные книги и журналы во многих странах уже охвачены законом об обязательном хранении. Их количество постоянно растет Так например, электронный архив Королевской библиотеки Нидерландов содержит 9 млн статей из 2800 естественнонаучных и технических журналов, и охватывает продукцию всего лишь 8 издательств. Массивы электронных документов в национальных библиотеках Web материалы - результаты автоматизированного сбора материала (harvesting), примеры: Королевская библиотека Дании за три месяца собрала 5,3 терабайта информации Национальная библиотека Франции за 2004 год собрала 3 терабайта информации Один терабайт по приблизительной оценке соответствует 13,5 млн страниц Что необходимо для цифрового хранения? 1) Организация. Хранением цифровых материалов должны заниматься организации, которые могут взять на себя долгосрочные обязательства, обеспечить поддержку технологий, подготовку кадров, имеют устойчивое финансирование. Что необходимо для цифрового хранения? 2) Программно-аппаратное обеспечение В последние годы появились коммерческие системы, называемые «цифровые архивы». Системы разработаны с учетом международных стандартов (ISO) и основаны на системах OAIS (Open Archive Initiative Systems). RLG занималась разработкой процедуры сертификации таких систем. Некоторые библиотеки (Германия, Нидерланды) на сентябрь 2006 уже имели такие системы. В некоторых национальных библиотеках (Франция, Швеция) их планировали внедрить в конце 2006 года. Что необходимо для цифрового хранения? 3) Метаданные, сохраняемый документ: описывающие Библиографическое описание Структурное описание (формат и структура данных) Описание системы хранения другие. В настоящее время разрабатываются стандарт на наборы метаданных. Что необходимо для цифрового хранения? 4) Обеспечение постоянного доступа к сохраняемым материалам: Сохраняемые материалы, как правило, разнородны (тексты, графика, аудио, видео материалы) Необходима поддержка программной среды, позволяющей использовать эти материалы Стратегии хранения, обеспечивающие постоянный доступ к данным 1. Миграция данных. Под миграцией понимается конвертирование данных, приспособление их к новой версии программного средства. Однако, в ходе конвертирования данных некоторая часть информации теряется, в результате цифровой объект с течением времени несколько меняется Стратегии хранения, обеспечивающие постоянный доступ к данным 2.Эмуляция Под эмуляцией понимается имитация оригинальной программной среды в новой программной среде. При этом сохраняемые материалы остаются неизменными. Управление цифровыми объектами (Digital Object Management - DOM) Так называемая «идеальная» схема организации обработки, хранения и использования электронных документов (DOM) приводится по публикации Ричарда Мастерса (Британская Библиотека) Европейские проекты по долгосрочному хранению, начатые 2006 г. DPE (Digital Preservation Europe) Проект, цель которого – поддержка сотрудничества в области сохранности документов, учет и координация разработок в этой области Caspar (Cultural, Artistic, and Scientific Knowledge for Preservation, Access and Retrieval) Проект касается в основном предметов искусства, науки и культуры Planets, Digital Preservation Research and Technology Организация, планирование, разработка технологий хранения цифровых объектов