Сценарии использования архивов сетевых электронных документов различными типами пользователей цифровых библиотек Зайцев А.В. Переход в цифровую форму 2 Веб-архивы • Около 70 организаций, занимающихся вебархивированием • 53 сформированных архива – Объем от 30 тыс. до 80 млрд. объектов хранения – Занимают от 300 Гб до 1000 Тб – Форматы хранения: ARC, WARC, HTTrack 3 География проектов 4 Сетевые электронные документы Стили (CSS) Изображения Надстройки (Flash / Silverlight) Веб-страница Скрипты и программы (JavaScript, …) Фреймы (HTML, …) Мультимедиа (HTML5) 5 Изменение с течением времени Апрель Август Ноябрь 6 Wayback Machine 7 Сценарии использования • Поиск утраченной/снятой с публикации информации • Исследования в интернете, обзоры, аналитика • Формирование постоянных ссылок • Использование в качестве доказательной базы • Резервные копии сайтов • Для размещения экземпляров электронных изданий 8 Основные требования • Тематический и широкий(broad) отбор документов, небольшие периоды между проведением отборов • Авторитетная организация, обеспечивающая хранение данных в аутентичном виде • Возможность организации долгосрочного хранения большого объема данных, с формированием постоянных ссылок • Достаточные мощности для обеспечения обработки большого массива данных, поиска, индексации, работы с метаданными и описаниями. 9 Основные требования • Открытый доступ для всех пользователей, либо доступ в стенах организации для защищенных ресурсов • Исключение архивов из индексов поисковых систем для предотвращения конфликта с оригинальными сайтами • Инструменты содействия созданию резервной копии материалов веб-сайтов • Создание различных точек доступа к ресурсам в т.ч. создание коллекций, интегрированных с библиотечными коллекциями. Группировка ресурсов по различным признакам • Индивидуальный подход к каждому электронному изданию, журналу и прочих СМИ. 10 Спасибо за внимание! ФГБУ «Президентская библиотека имени Б.Н. Ельцина» Отдел поддержки интернет-портала [email protected] Санкт-Петербург 2014 11