Цифровое восстановление изображений филиграней А.В. Карнаухов(*), И. Айзенберг($), А. Хайдингер(-), В.Н. Карнаухов(*), Н.С. Мерзляков(*),О.П. Милюкова(*), Э. Венгер (#). Институт проблем передачи информации Российской Академии Наук, Москва, Россия e-mail: [email protected], [email protected], [email protected], [email protected] (*) Технологии нейронных сетей, Тель-Авив, Израиль E-mail: [email protected] ($) (-) Комиссия палеографии и кодикологии средневековых рукописей Австрийской Академии Наук Вена, Австрия e-mail: [email protected] Комиссия научной визуализации Австрийской Академии Наук Вена, Австрия e-mail: [email protected] (#) Аннотация Возможно ли применение традиционных методов восстановления изображений для восстановления изображений водяных знаков? Объектом исследования данной статьи являются копии водяных знаков средневековых документов полученных с помощью бета-радиографии. Для восстановления изображений водяных знаков используется подход, основанный на методе быстрого преобразования Фурье. Разработано программное обеспечение в рамках интегрированной системы для цифровой обработки и идентификации изображений водяных знаков, а также для управления базой данных. Представлены результаты эксперимента по восстановлению изображений водяных знаков, восстановленных с использованием Тихоновской регуляризации. 1. Введение Водяные знаки широко используются в течение последних 100 лет для временной идентификации и классификации исторических документов и соответствующих им исторических событий. Для идентификации водяного знака, историки, инкунабулисты и другие исследователи используют каталоги водяных знаков, изданные в десятках томов по всем мире [1,2]. Изображения в этих каталогах представляют собой графические копии водяных знаков, которые, в основном, были получены калькированием со страниц манускриптов, инкунабул и других исторических документов. Идентичность водяного знака с образцом в стандартных каталогах является хороший индикатором его возраста, возраста бумаги и возраста рассматриваемого документа. Поэтому хронологическая идентификация и классификация исторических документов и соответствующих им исторических событий, при таком подходе проводится простым поиском идентичных или подобных водяных знаков в каталогах и выполнении некоторых измерений с помощью обычной линейки. Низкая эффективность такого подхода очевидна. До XIX столетия вся бумага изготовлялись с использованием специальной формы, которая представляла собой прямоугольное сито, состоящее из рамки и основания, выполненного в виде очень густой сетки. Для придания прочности эта сетка-сито скреплялась в перпендикулярном направлении второй очень редкой сеткой. Начиная с тринадцатого столетия, и в течение длительного времени, все европейские производители бумаги маркировали свою продукцию водяными знаками или филигранью. Рисунки водяных знаков создавались с помощью тонких плоских проволочных фигурок различной конфигурации, встраиваемых в сито. Форма с ситом погружалась в емкость с жидкой пульпой и наполнялась ею. После подъема формы, жидкость стекала через сито, а плотная масса пульпы оседала на дне сита, заполняя все неровности сита. Таким образом, обе сетки и филигрань оказывались “впечатанными” в бумагу, создавая три графических объекта используемых для идентификации полученной бумаги: филигрань, верже и понтюзо. В силу естественных технологических ограничений того времени, долговечность формы для производства бумаги была невелика. Формы, и особенно, сито и филиграни находились в использовании всего один-два года или даже несколько месяцев. Таким образом, определив возраст водяного знака, можно датировать недатированные рукописи в случае, если в исследуемых рукописях находятся водяные знаки, идентичные датированным. В те времена, водяные знаки выполняли функцию торгового знака изготовителя бумаги. После выхода из строя формы, производитель, в целях сохранения своей торговой марки, был должен отремонтировать или, что было чаще, изготовить новую форму со своей торговой маркой - водяным знаком. В такие формах филигрань, верже и понтюзо немного, а иногда и существенно отличались от своих предыдущих аналогов. Поэтому для правильного датирования такого слегка видоизмененного водяного знака, вся структура сита должна быть также проанализирована, т.е. и филигрань, и верже, и понтюзо. 2. Цифровые методы восстановления изображений Водяной знак отображается на бумаге старых книг и документов в виде небольшие изменений толщины бумаги, на которой написаны или напечатаны данная книга или документ. Эти изменения толщины могут быть выявлены, визуализированы и скопированы различными методами. На сегодняшний день, электронная радиография и бета-радиография, представляются лучшими методами получения копий изображений водяных знаков, в силу высокого качества получаемых результатов. Малые отклонения в толщине бумаге достаточно хорошо регистрируются этими методами. Типичное изображение водяного знака, полученное бета-радиографическим методом показано на Рис. 1. Филигрань, верже и понтюзо зарегистрированы в виде неоднородной структуры широких смазанных (расплывчатых) линий низкого контраста, искаженных шумом, в качестве которого рассматриваются контрастные черные и белые пятна различных форм и размеров. Рис. 1 Типичное изображение водяного знака, полученное бета-радиографическим методом. Вообще говоря, мы можем рассматривать эти смазанные изображения филиграни, верже и понтюзо как искаженные изображения исходных “идеальных” объектов. Исходя из этого, мы можем свести нашу задачу получения неискаженных изображений водяных знаков, к задаче цифрового восстановления изображений филиграни, верже и понтюзо полученных методами электронной или бета радиографии. Восстановление изображений часто определяется как процесс оценки исходного изображения по его некоторой искаженной версии [3]. Задача восстановления обычно формулируется следующим образом: пусть u~x, y - заданное искаженное изображение, необходимо оценить исходное неискаженное zx, y , используя следующее уравнение: u~ ( x, y ) u ( x, y ) n( x, y ), или в матричной форме: u~ Az n, x, y , (1) (2) где A - линейный оператор, ux, y - смазанное исходное изображение, nx, y - шум, u~x, y - наблюдаемое смазанное и зашумленное изображение. Существует много различных подходов к решению этой задачи. Наиболее универсальными методами являются регуляризационные и статистические методы (см., например, [3-5]). В обоих случаях, решение задачи восстановления может быть сведено к оценке условного или безусловного экстремума некоторого функционала. К сожалению, в общем, двумерном случае, прямое решение задачи минимизации достаточно сложно. Упрощение задачи минимизации обычно основывается на использовании определенных свойств интегрального оператора A (см. уравнение (2)). Например, если изображающая система может быть описана однородным оператором A , а искаженное изображение u~x, y определено на всей области x, y , , то уравнение (1) принимает вид уравнения типа свертки. В этом случае, искаженное изображение определяется следующим уравнением: u~ ( x, y ) h( x , y ) z ( , )dd n( x, y ), (3) где u~ ( x, y ) - искаженное изображение, h( x , y ) - функция рассеяния точки изображающей системы, n( x, y ) - шум и z ( , ) - искомое исходное изображение. Это уравнение может быть сравнительно легко решено методом быстрого преобразования Фурье [3]. Следует особо подчеркнуть, что искаженное изображение u~x, y имеет ограниченные размеры и, следовательно, определено в ограниченной области. Это ограничение не позволяет применять преобразование Фурье непосредственно к уравнению (3). Для того чтобы его преодолеть, необходимо расширить определение изображения на всю область x, y , [6]. Сверточный характер уравнения (3) позволяет записать его в эквивалентном Фурье-представлении следующем образом: ~ U ( f x , f y ) Z ( f x , f y ) H ( f x , f y ) N ( f x , f y ), ~ где U ( f x , f y ), Z ( f x , f y ), and N ( f x , f y ) - спектры Фурье искаженного, исходного изображений и шума, соответственно, и H ( f x , f y ) - искажающая передаточная функция. Известно, что общее линейное решение уравнения (3) может быть записано как: zˆ ( , ) K ( s, t )u~ (s, t )dsdt , где ядро инверсии имеет следующую форму: K ( s, t ) 1 4 2 R( f x , f y )e i ( sf x tf y ) df x df y 1 4 2 H * ( f x , f y )e i ( sf x tf y ) 2 H ( f x , f y ) ( f x , f y ) df x df y и R( f x , f y ) - восстанавливающий фильтр, и ( f x , f y ) - заданная функция. В присутствии шума, оптимальным восстанавливающим фильтром (по MSE критерию) является винеровский фильтр [3] H *( fx, fy ) R( f x , f y ) , S nn ( f x , f y ) 2 H( fx, fy ) S zz ( f x , f y ) (4) где H ( f x , f y ) - искажающая передаточная функция, S nn ( f x , f y ) и S zz ( f x , f y ) спектральные плотности мощности шума и исходного изображения, которые считаются известными. При этом предполагается, что шум является белым, а изображение и шум статистически независимы. Этот метод хорошо работает для изображений с высоким соотношением сигнал/шум (SNR), но плохо подходит для восстановления изображений с низким SNR. 3. Программное обеспечение и экспериментальные результаты Для экспериментальной реализации данного подхода мы выбрали линейную модель искажения изображения (3) и использовали метод преобразования Фурье для восстановления изображений водяных знаков средневековых рукописей. Мы использовали винеровский восстанавливающий фильтр (4) и один из частных случаев восстанавливающего регуляризирующего фильтра Тихонова [5] со следующей передаточной функцией: R( f x , f y ) H *( fx, fy ) 2 H ( f x , f y ) (1 ( f f )) 2 x , (5) 2 y где H ( f x , f y ) - искажающая передаточная функция, и - неотрицательные параметры регуляризации. Результаты эксперимента по восстановлению изображений водяных знаков с использованием регуляризирующего фильтра (5) показаны на Рис. 2, где (a) искаженное изображение водяного знака и (b) восстановленное изображение. Результаты эксперимента по восстановлению изображений водяных знаков с использованием винеровского фильтра показаны на Рис. 3, где (a) искаженное изображение водяного знака и (b) восстановленное изображение. Всё необходимое программное обеспечение было разработано в рамках интегрированной системы цифровой обработки, идентификации изображений водяных знаков и управления базой данных. Ее детальное описание дано в [7]. Взаимодействие пользователя с системой реализовано через удобный графический интерфейс пользователя. Система выполнена на платформе PC и работает под управлением операционной системы Windows 95/98/NT4/2000 и выше. Благодарности Работа поддержана Российским фондом фундаментальных исследований в рамках проектов РФФИ 99-07-90017 и РФФИ 01-07-90354. Литература 1. Briquet Ch. M., Les Filigranes. Dictionnaire historique des marques du papier dés leur apparition vers 1282 jusqu’en 1600. Paris 1907. 2. Piccard G., Die Wasserzeichenkartei Piccard im Hauptstaatsarchiv Stuttgart. Findbuch I-XV, W. Kohlhammer, Stuttgart, 1966-1987. 3. Прэтт У. Цифровая обработка изображений: Пер. с англ. - М.: Мир, 1982. 4. Тихонов А.Н., Арсенин В.Ж. Методы решения некорректных задач. – М.: Наука, 1983. 5. Тихонов А.Н., Гончарский А.В., Степанов В.В. и Ягола А.Г. Численные методы решения некорректных задач. – М.: Наука, 1990. 6. Milukova O.P. Fourier transform in restoration problem. Proc.SPIE, Vol.2363, 1995, pp.98-103. 7. V.N.Karnaukhov, E.Wenger, A.Haidinger, N.S.Merzlyakov, Y.J. Zhang. An Integrated System for Digital Processing and Identification of Watermark Images. First International Conference on Image and Graphics, August 16-18, Tianjin, China, 2000, p.119-122. а b Рис. 2 Экспериментальные результаты: (a) искаженное изображение; (b) изображение, восстановленное с использованием винеровского фильтра (4). а b Рис. 3 Экспериментальные результаты: (a) искаженное изображение; (b) изображение, восстановленное с использованием регуляризируюшего фильтра (5).