Основной задачей поставленной программисту при разработке

advertisement
Автоматизированная система учета и реставрации архивных рукописных
материалов Муромского историко-художественного музея
Канунова Екатерина Евгеньевна
аспирант кафедры «Информационные системы»
Муромский Институт Владимирского Государственного Университета
Адрес: 602200, Муром, Владимирской обл. ул. Энгельса д. 15 кв. 90.
Тел: (809234) 35963
E-mail: asp_kat@rambler.ru
Садыков Султан Садыкович
д.т.н., профессор кафедры «Информационные системы»
Муромский Институт Владимирского Государственного Университета
Адрес: 602200, Муром, Владимирская обл. ул. Трудовая д. 21 кв. 92
Тел: д. (809234)49875 р. (809234)37222
E-mail: is@mivlgu.ru
В
настоящее
время
интенсивно
внедряются
современные
информационные технологии, обработка, хранение и передача информации во
все сферы деятельности человека. Особое значение эти технологии имеют для
хранения, реставрации и передачи на большие расстояния архивных
документов. Во многих музеях и архивах мира осуществляется формирование
компьютерных версий своих коллекций.
Некоторые российские фирмы
занимаются разработкой компьютерных музейных систем, предназначенных
для учета архивных материалов и музейных коллекций. Так, например, в
Муромском историко-художественном музее разработана автоматизированная
система учета фондов (АСУФ), которая в настоящее время проходит
тестирование в музее1.
Сегодня практически у каждого музея есть свой сайт в Интернете,
который носит информативный и презентационный характер. Тем самым музеи
предоставляют многим людям информацию о себе, о своей деятельности и о
содержании своих фондов. Еще одним немаловажным направлением
использования
современных
информационных
технологий
является
автоматическая процедура реставрации архивных документов.
Архивные исторические документы, которые хранятся в Муромском
историко-художественном музее имеют большую историческую ценность для
работников различных учреждений, занимающихся изучением и исследованием
истории Мурома и Муромского края. Они,
наряду с музейными и
библиотечными фондами составляют фундаментальный массив многоплановой
информации о жизни и деятельности народов, использование этой информации
- основа дальнейшего развития культуры и науки. При долгом хранении
архивные документы
приобретают значительные дефекты, которые
способствуют потере их информативности. Так, например, в Муромском
историко-художественном музее хранится около 140 рукописных книг с начала
16-ого по начало 19-ого века и около 2000 документов (векселей, дарственных
грамот и т.п) с 16 по начало 20-ого века. Из них около 90 книг и 200 документов
требуют восстановления. Проблема обеспечения сохранности и реставрации
архивных документов является предметом исследования многих российских и
зарубежных ученых. В Муромском музее в сотрудничестве с Муромским
институтом Владимирского государственного университета ведется работа по
созданию автоматизированной системы реставрации архивных материалов. К
настоящему времени разработаны модули, предназначенные для устранения
дефектов на рукописных и старопечатных книгах (документах). В ближайшем
будущем предполагается дополнить систему модулями автоматизированной
реставрации изображений фотодокументов.
Реставрация архивного текстового документа предусматривает
восстановление текстовой информации в максимально близком к оригиналу
виде, восстановление разрушенных участков основы документа или перенос
текста на новый более долговечный носитель. В практике архивного дела
применяются различные методы реставрации текстовых документов: ретушь,
химический
способ
восстановления
текстовой
информации,
электрографический метод восстановления текстов, оптико-фотографические
методы и цифровые методы, т.е. автоматизированные.
Метод автоматической реставрации текстовых документов по сравнению
с другими методами обладает рядом достоинств:
- позволяет устранять самые разнообразные дефекты (нерезкость, слабый
контраст, пятна и т.д.);
- дает возможность исправления, как всего изображения документа, так и
отдельных его участков;
- обеспечивает полную сохранность оригинала, так как преобразованиям
подвергается не сам текстовый документ, а его электронная копия;
- позволяет многократно производить с заданной точностью любые
преобразования изображения текстового документа;
- устраняет значительную часть трудоемких ручных операций.
Автоматическая реставрация состоит из следующих основных операций:
- оцифровка текстового документа;
- машинный анализ дефектов текстового материала;
- выбор способов для устранения дефекта на изображении;
- определение параметров обработки;
- обработка изображения текстового материала;
- контроль результатов реставрации;
- перевод отреставрированной цифровой копии документа на бумажную
основу2.
Рассмотрим дефекты, характерные для архивных рукописных
материалов.
Рукописный документ представляет собой систему, состоящую из
носителя информации (бумага) и средств фиксации информации – красители,
чернила, карандаш и т.п.
Вследствие этого дефекты рукописных материалов можно разделить на
две основные группы:
1. дефекты бумажной основы документа;
2. дефекты, обуславливаемые средствами фиксации текстовой
информации.
Дефекты бумажной основы:
дефекты, вызываемые деформацией бумаги: удлинение или
усадка листа; коробление; скручивание
частичное или полное разрушение бумаги, повышенная
ломкость и хрупкость
утрата отдельных частей листа бумаги (действие грызунов:
отверстия на бумаге; обгрызание краев бумаги, корешков)
склеивание листов (основная причина – это плесневые грибы)
механические повреждения: складки, разрывы листов, следы
частых перегибов, проколы
пожелтение бумаги (вследствие долгого хранения, зависит от
свойств и состава бумаги)
пятна на бумаге (грязь, пигментные пятна, пятна, вызванные
действием грибов, воск и т.п. )
коричневый цвет краев листа (обгоревшие, подмоченные и
другие компоненты)
Дефекты,
обуславливаемые
средствами
фиксации
текстовой
информации:
выцветание текста – естественное “темновое” локальное или по
всему полю выцветание (музейный термин – “угасание” текста)
слабый контраст текстов
осыпание текста (вследствие появления складок, разрывов)
появление размазанных текстов (в следствие подмокания
листов, повышенной влажности воздуха в местах хранения архивов)
нарушение конфигурации отдельных символов.
Следует отметить, что для визуального анализа рукописного материала
достаточно выбрать следующие единичные показатели качества:
1. контраст между штрихами текста и фоном изображения
2. полнота информации, извлекаемая при чтении рукописного
материала
3. отсутствие помех – пятен, загрязнений, порывов, проколов и т.п.
С точки зрения реставрации можно выделить следующие виды дефектов:

слабый контраст текстов по всему полю документа или
локальный;

неравномерность фона по всему полю
документа или в
локальных участках;

полупрозрачные пятна с постоянной прозрачностью;

непрозрачные пятна, разрывы;

мелкие полупрозрачные пятна в виде точек, крапа;

протяженные полупрозрачные пятна -складки листа;

протяженные непрозрачные пятна – разрывы;

мелкие полупрозрачные протяженные пятна – мелкие складки;

мелкие непрозрачные протяженные пятна - мелкие разрывы и
царапины;

точечные дефекты, размером не более девяти пикселей;

проступание надписей с обратной стороны листа;

шум в виде неравномерных загрязнений листа;

ненужная информация (пометки, помарки и т.п.)3.
Для каждого, из рассмотренных видов дефектов разработана своя
процедура их устранения. Основная задача, которая ставилась перед
разработчиком системы – это в максимальной степени свести процесс
реставрации документов к автоматическому режиму и тем самым оградить
оператора от лишней работы.
Система автоматизированной реставрации включает несколько модулей:
- модуль поиска и устранения локальных дефектов (мелких, средних и
крупных непрозрачных и полупрозрачных пятен; царапин; трещин; перегибов);
- модуль анализа изображений архивных материалов на контрастность;
- модуль восстановления контраста слабоконтрастных изображений
архивных материалов (позволяет устранять локальное потускнение штрихов
текста и по всему полю документа).
- модуль устранения проступаний надписей с обратной стороны листа на
изображениях рукописных архивных материалов
Система работает в двух режимах: диалоговом и автоматизированном.
Диалоговый режим реализован в виде надстройки графического редактора
Adobe Photoshop в виде включения в него дополнительных фильтров,
позволяющих устранять дефекты. Каждый фильтр представляет собой файл с
расширением 8bf, который включает в себя процедуру реставрации
определенного дефекта. Надстройка редактора производится простым
копированием 8bf-файлов в подкаталог Plug-Ins рабочего каталога Adobe.
Автоматизированный режим реализован в виде отдельной программы,
которая без дополнительных настроек ставится на компьютер пользователя и
включает в себя все рассмотренные выше модули. Программа написана на
языке программирования Object Pascal в среде визуального программирования
Delphi. Система снабжена удобным и понятным для начинающего пользователя
интерфейсом и предназначена для работы с ней хранителей рукописей, книг,
фотографий и специалистов, занимающихся вопросами реставрации. Рабочая
область системы включает разделы для просмотра исходных изображений
документов в формате bmp и их фрагментов, разделы для просмотра
обработанных изображений документов и их фрагментов, разделы для
просмотра гистограмм распределений исходных и обработанных изображений.
Естественно, если оператор не доволен работой алгоритма, то он может
отменить те или действия при работе с изображениями.
Основные возможности системы:
- открытие изображений в формате bmp и сохранение обработанных
изображений в любом формате (jpeg, bmp, tiff) (Меню Файл/Открыть
изображение и Файл/Сохранить изображение). Отмена выполненной
обработки (Меню Файл/Отменить );
- восстановление слабого контраста (Меню Восстановление
контраста/С использованием опорных точек (для восстановления сильного
выцветания); Восстановление контраста/Адаптивное коррекция (для
восстановления неравномерного выцветания документов); Восстановление
контраста/Локальное восстановление (для восстановления контраста в
отдельных участках изображения); Восстановление контраста/Глобальное
восстановление (для восстановления контраста по всему полю документа) и
Восстановление контраста/ Анализ изображения на контрастность.
Последний пункт меню предназначен для машинного анализа изображений и, в
зависимости от типа изображения, выбора определенного алгоритма
восстановления контраста. Т.е. пользователь может либо на основе визуального
анализа выбрать тот или иной метод восстановления контраста, либо запустить
процесс автоматического анализа и восстановления документа);
- устранение локальных дефектов (пятен, царапин, мелкого крапа и т.п.).
Здесь также как и при восстановлении контраста, оператор может устранять
локальные дефекты в ручную, т.е. выбора мышкой области на изображении,
содержащей локальный дефект и выбора определенного пункта меню для его
устранения, либо автоматически путем запуска процедуры поиска и устранения
всех видов локальных дефектов. Ручной режим: (Меню Локальные
дефекты/Устранение мелких пятен; Локальные дефекты/Устранение средних
пятен округлой формы; Локальные дефекты/Устранение протяженных
дефектов; Локальные дефекты/Устранение полупрозрачных дефектов;
Локальные дефекты/Устранение непрозрачных дефектов). Автоматический
режим: (Меню Локальные дефекты/Поиск и устранение);
- устранение проступания надписей с обратной стороны листа. Данный
вид дефекта, наряду с локальными дефектами, очень часто встречается на
архивных рукописных и старопечатных документах, поэтому его устранение
также является актуальным (Меню Устранение проступания надписей);
- методы сегментации. Это отдельная группа модулей, задача которых
устранение различных видов дефектов (это могут быть локальные дефекты,
неравномерность фона, желтизна страниц, помарки, пометки и т.п.). (Меню
Сегментация/Автоматическая классификация; Сегментация/Сегментация по
гистограмме и Сегментация/Локальная сегментация – для устранения
локальных дефектов, желтизны страниц, неравномерности фона;
- обработка цветных документов – (Меню Обработка цветных
изображений) предназначена для устранения дефектов на изображениях
цветных архивных документов и включает в себя методы сегментации цветных
изображений, предназначенные для устранения локальных дефектов, желтизны
страниц и восстановления контраста.
Следует заметить, что система не предназначена для реконструкции
текстовых символов, так как это очень трудоемкий процесс, включает в себя
методы распознавания образов, а распознать рукописные символы различных
авторов определенных временных периодов очень сложно.
Пример реставрации изображения текстового документа, содержащего
пятна приведен ниже.
Рисунок 1 – Изображение архивного
текстового документа, содержащего пятна
округлой формы
Рисунок 2 – Результат устранения
пятен округлой формы
Список литературы
Канунова Е.Е., Тюрина Е.К Автоматизированная система учета фондов – теория
и практика.. Материалы шестой международной конференции ЕВА’2003.
2.
Садыков С.С., Канунова Е.Е. Вопросы устранения дефектов на архивных
рукописных материалах../ Пенза симпозиум «Надежность и качество 2004»
3.
Канунова Е.Е., Садыков С.С. Дефекты рукописных архивных документов и
возможные методы их устранения. Обработка информации: методы и системы: Сборник
научных статей/ Под ред. Садыкова С.С., Андрианова Д.Е. – М.: Горячая линия –
Телеком, 2003 г. – 231 с. (с. 9 - 12).
1.
Download