Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея Канунова Екатерина Евгеньевна аспирант кафедры «Информационные системы» Муромский Институт Владимирского Государственного Университета Адрес: 602200, Муром, Владимирской обл. ул. Энгельса д. 15 кв. 90. Тел: (809234) 35963 E-mail: [email protected] Садыков Султан Садыкович д.т.н., профессор кафедры «Информационные системы» Муромский Институт Владимирского Государственного Университета Адрес: 602200, Муром, Владимирская обл. ул. Трудовая д. 21 кв. 92 Тел: д. (809234)49875 р. (809234)37222 E-mail: [email protected] В настоящее время интенсивно внедряются современные информационные технологии, обработка, хранение и передача информации во все сферы деятельности человека. Особое значение эти технологии имеют для хранения, реставрации и передачи на большие расстояния архивных документов. Во многих музеях и архивах мира осуществляется формирование компьютерных версий своих коллекций. Некоторые российские фирмы занимаются разработкой компьютерных музейных систем, предназначенных для учета архивных материалов и музейных коллекций. Так, например, в Муромском историко-художественном музее разработана автоматизированная система учета фондов (АСУФ), которая в настоящее время проходит тестирование в музее1. Сегодня практически у каждого музея есть свой сайт в Интернете, который носит информативный и презентационный характер. Тем самым музеи предоставляют многим людям информацию о себе, о своей деятельности и о содержании своих фондов. Еще одним немаловажным направлением использования современных информационных технологий является автоматическая процедура реставрации архивных документов. Архивные исторические документы, которые хранятся в Муромском историко-художественном музее имеют большую историческую ценность для работников различных учреждений, занимающихся изучением и исследованием истории Мурома и Муромского края. Они, наряду с музейными и библиотечными фондами составляют фундаментальный массив многоплановой информации о жизни и деятельности народов, использование этой информации - основа дальнейшего развития культуры и науки. При долгом хранении архивные документы приобретают значительные дефекты, которые способствуют потере их информативности. Так, например, в Муромском историко-художественном музее хранится около 140 рукописных книг с начала 16-ого по начало 19-ого века и около 2000 документов (векселей, дарственных грамот и т.п) с 16 по начало 20-ого века. Из них около 90 книг и 200 документов требуют восстановления. Проблема обеспечения сохранности и реставрации архивных документов является предметом исследования многих российских и зарубежных ученых. В Муромском музее в сотрудничестве с Муромским институтом Владимирского государственного университета ведется работа по созданию автоматизированной системы реставрации архивных материалов. К настоящему времени разработаны модули, предназначенные для устранения дефектов на рукописных и старопечатных книгах (документах). В ближайшем будущем предполагается дополнить систему модулями автоматизированной реставрации изображений фотодокументов. Реставрация архивного текстового документа предусматривает восстановление текстовой информации в максимально близком к оригиналу виде, восстановление разрушенных участков основы документа или перенос текста на новый более долговечный носитель. В практике архивного дела применяются различные методы реставрации текстовых документов: ретушь, химический способ восстановления текстовой информации, электрографический метод восстановления текстов, оптико-фотографические методы и цифровые методы, т.е. автоматизированные. Метод автоматической реставрации текстовых документов по сравнению с другими методами обладает рядом достоинств: - позволяет устранять самые разнообразные дефекты (нерезкость, слабый контраст, пятна и т.д.); - дает возможность исправления, как всего изображения документа, так и отдельных его участков; - обеспечивает полную сохранность оригинала, так как преобразованиям подвергается не сам текстовый документ, а его электронная копия; - позволяет многократно производить с заданной точностью любые преобразования изображения текстового документа; - устраняет значительную часть трудоемких ручных операций. Автоматическая реставрация состоит из следующих основных операций: - оцифровка текстового документа; - машинный анализ дефектов текстового материала; - выбор способов для устранения дефекта на изображении; - определение параметров обработки; - обработка изображения текстового материала; - контроль результатов реставрации; - перевод отреставрированной цифровой копии документа на бумажную основу2. Рассмотрим дефекты, характерные для архивных рукописных материалов. Рукописный документ представляет собой систему, состоящую из носителя информации (бумага) и средств фиксации информации – красители, чернила, карандаш и т.п. Вследствие этого дефекты рукописных материалов можно разделить на две основные группы: 1. дефекты бумажной основы документа; 2. дефекты, обуславливаемые средствами фиксации текстовой информации. Дефекты бумажной основы: дефекты, вызываемые деформацией бумаги: удлинение или усадка листа; коробление; скручивание частичное или полное разрушение бумаги, повышенная ломкость и хрупкость утрата отдельных частей листа бумаги (действие грызунов: отверстия на бумаге; обгрызание краев бумаги, корешков) склеивание листов (основная причина – это плесневые грибы) механические повреждения: складки, разрывы листов, следы частых перегибов, проколы пожелтение бумаги (вследствие долгого хранения, зависит от свойств и состава бумаги) пятна на бумаге (грязь, пигментные пятна, пятна, вызванные действием грибов, воск и т.п. ) коричневый цвет краев листа (обгоревшие, подмоченные и другие компоненты) Дефекты, обуславливаемые средствами фиксации текстовой информации: выцветание текста – естественное “темновое” локальное или по всему полю выцветание (музейный термин – “угасание” текста) слабый контраст текстов осыпание текста (вследствие появления складок, разрывов) появление размазанных текстов (в следствие подмокания листов, повышенной влажности воздуха в местах хранения архивов) нарушение конфигурации отдельных символов. Следует отметить, что для визуального анализа рукописного материала достаточно выбрать следующие единичные показатели качества: 1. контраст между штрихами текста и фоном изображения 2. полнота информации, извлекаемая при чтении рукописного материала 3. отсутствие помех – пятен, загрязнений, порывов, проколов и т.п. С точки зрения реставрации можно выделить следующие виды дефектов: слабый контраст текстов по всему полю документа или локальный; неравномерность фона по всему полю документа или в локальных участках; полупрозрачные пятна с постоянной прозрачностью; непрозрачные пятна, разрывы; мелкие полупрозрачные пятна в виде точек, крапа; протяженные полупрозрачные пятна -складки листа; протяженные непрозрачные пятна – разрывы; мелкие полупрозрачные протяженные пятна – мелкие складки; мелкие непрозрачные протяженные пятна - мелкие разрывы и царапины; точечные дефекты, размером не более девяти пикселей; проступание надписей с обратной стороны листа; шум в виде неравномерных загрязнений листа; ненужная информация (пометки, помарки и т.п.)3. Для каждого, из рассмотренных видов дефектов разработана своя процедура их устранения. Основная задача, которая ставилась перед разработчиком системы – это в максимальной степени свести процесс реставрации документов к автоматическому режиму и тем самым оградить оператора от лишней работы. Система автоматизированной реставрации включает несколько модулей: - модуль поиска и устранения локальных дефектов (мелких, средних и крупных непрозрачных и полупрозрачных пятен; царапин; трещин; перегибов); - модуль анализа изображений архивных материалов на контрастность; - модуль восстановления контраста слабоконтрастных изображений архивных материалов (позволяет устранять локальное потускнение штрихов текста и по всему полю документа). - модуль устранения проступаний надписей с обратной стороны листа на изображениях рукописных архивных материалов Система работает в двух режимах: диалоговом и автоматизированном. Диалоговый режим реализован в виде надстройки графического редактора Adobe Photoshop в виде включения в него дополнительных фильтров, позволяющих устранять дефекты. Каждый фильтр представляет собой файл с расширением 8bf, который включает в себя процедуру реставрации определенного дефекта. Надстройка редактора производится простым копированием 8bf-файлов в подкаталог Plug-Ins рабочего каталога Adobe. Автоматизированный режим реализован в виде отдельной программы, которая без дополнительных настроек ставится на компьютер пользователя и включает в себя все рассмотренные выше модули. Программа написана на языке программирования Object Pascal в среде визуального программирования Delphi. Система снабжена удобным и понятным для начинающего пользователя интерфейсом и предназначена для работы с ней хранителей рукописей, книг, фотографий и специалистов, занимающихся вопросами реставрации. Рабочая область системы включает разделы для просмотра исходных изображений документов в формате bmp и их фрагментов, разделы для просмотра обработанных изображений документов и их фрагментов, разделы для просмотра гистограмм распределений исходных и обработанных изображений. Естественно, если оператор не доволен работой алгоритма, то он может отменить те или действия при работе с изображениями. Основные возможности системы: - открытие изображений в формате bmp и сохранение обработанных изображений в любом формате (jpeg, bmp, tiff) (Меню Файл/Открыть изображение и Файл/Сохранить изображение). Отмена выполненной обработки (Меню Файл/Отменить ); - восстановление слабого контраста (Меню Восстановление контраста/С использованием опорных точек (для восстановления сильного выцветания); Восстановление контраста/Адаптивное коррекция (для восстановления неравномерного выцветания документов); Восстановление контраста/Локальное восстановление (для восстановления контраста в отдельных участках изображения); Восстановление контраста/Глобальное восстановление (для восстановления контраста по всему полю документа) и Восстановление контраста/ Анализ изображения на контрастность. Последний пункт меню предназначен для машинного анализа изображений и, в зависимости от типа изображения, выбора определенного алгоритма восстановления контраста. Т.е. пользователь может либо на основе визуального анализа выбрать тот или иной метод восстановления контраста, либо запустить процесс автоматического анализа и восстановления документа); - устранение локальных дефектов (пятен, царапин, мелкого крапа и т.п.). Здесь также как и при восстановлении контраста, оператор может устранять локальные дефекты в ручную, т.е. выбора мышкой области на изображении, содержащей локальный дефект и выбора определенного пункта меню для его устранения, либо автоматически путем запуска процедуры поиска и устранения всех видов локальных дефектов. Ручной режим: (Меню Локальные дефекты/Устранение мелких пятен; Локальные дефекты/Устранение средних пятен округлой формы; Локальные дефекты/Устранение протяженных дефектов; Локальные дефекты/Устранение полупрозрачных дефектов; Локальные дефекты/Устранение непрозрачных дефектов). Автоматический режим: (Меню Локальные дефекты/Поиск и устранение); - устранение проступания надписей с обратной стороны листа. Данный вид дефекта, наряду с локальными дефектами, очень часто встречается на архивных рукописных и старопечатных документах, поэтому его устранение также является актуальным (Меню Устранение проступания надписей); - методы сегментации. Это отдельная группа модулей, задача которых устранение различных видов дефектов (это могут быть локальные дефекты, неравномерность фона, желтизна страниц, помарки, пометки и т.п.). (Меню Сегментация/Автоматическая классификация; Сегментация/Сегментация по гистограмме и Сегментация/Локальная сегментация – для устранения локальных дефектов, желтизны страниц, неравномерности фона; - обработка цветных документов – (Меню Обработка цветных изображений) предназначена для устранения дефектов на изображениях цветных архивных документов и включает в себя методы сегментации цветных изображений, предназначенные для устранения локальных дефектов, желтизны страниц и восстановления контраста. Следует заметить, что система не предназначена для реконструкции текстовых символов, так как это очень трудоемкий процесс, включает в себя методы распознавания образов, а распознать рукописные символы различных авторов определенных временных периодов очень сложно. Пример реставрации изображения текстового документа, содержащего пятна приведен ниже. Рисунок 1 – Изображение архивного текстового документа, содержащего пятна округлой формы Рисунок 2 – Результат устранения пятен округлой формы Список литературы Канунова Е.Е., Тюрина Е.К Автоматизированная система учета фондов – теория и практика.. Материалы шестой международной конференции ЕВА’2003. 2. Садыков С.С., Канунова Е.Е. Вопросы устранения дефектов на архивных рукописных материалах../ Пенза симпозиум «Надежность и качество 2004» 3. Канунова Е.Е., Садыков С.С. Дефекты рукописных архивных документов и возможные методы их устранения. Обработка информации: методы и системы: Сборник научных статей/ Под ред. Садыкова С.С., Андрианова Д.Е. – М.: Горячая линия – Телеком, 2003 г. – 231 с. (с. 9 - 12). 1.