212 ИНВАРИАНТНОЕ ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ И КОЛИЧЕСТВА ИНФОРМАЦИИ В ЗАДАЧАХ ОБРАБОТКИ ИЗОБРАЖЕНИЙ1 M. В. Харинов2 2Санкт–Петербургский институт информатики и автоматизации РАН 199178, Санкт–Петербург, 14 линия В. О. д. 39 [email protected] Предлагается модель сигнала (изображения), обладающего цифровой «виртуальной» памятью с кодированной информацией, которая не зависит от растяжения, упаковки по яркости и др. предусмотренных преобразований сигнала. Запоминающие элементы виртуальной памяти содержат коды представления информации и при обработке разделяются на фиксированные и переменные, которые можно произвольно менять, не разрушая изображение. Число переменных запоминающих элементов, сопоставляемых пикселам изображения, трактуется как количество информации. Рассматривается применение модели для распознавания изображений, защиты документов и др. Введение Известно, что в современной информатике и, в частности, в обработке сигналов (изображений) понятие информации недостаточно структурировано и формализовано [1]. При этом понятия «информация», «сигнал» и «смысл» информации не всегда четко разграничиваются между собой, при рассмотрении количества информации обычно обходится вопрос об уточнении понятия самой информации, а также вопрос о верификации расчетных значений количества информации, локализованной в пикселах изображения. Необходимость уточнения понятия информации и количества информации возникает при обработке сигналов из заранее не ограниченной предметной области, например, при решении задачи «слепой» стеганографии, в которой требуется обратимо встроить один сигнал в другой при условии, что оба сигнала при приеме не известны. Другим примером является общая проблема распознавания изображения, в которой для унификации выделения или идентификации объектов полезны общие признаки пиксела, дополняющие яркость. Для уточнения понятия информации и решения указанных задач мы разработали модель изображения, в которой оно рассматривается как запоминающая среда и своеобразное средство или устройство для хранения и передачи кодированной информации [2]. Согласно модели атрибутом изображения является цифровая «виртуальная» память, которая подобна памяти компьютера и способна хранить коды информации независимо от предусмотренных преобразований изображения. Особенности виртуальной памяти Виртуальная память определяется как абстрактная матрица ячеек с кодами информации, которые вычисляются по изображению с сохранением порядка яркостей и определяют количество информации в пикселах изображения. Каждому пикселу изображения сопоставляется ячейка виртуальной памяти. В отличие от ячеек памяти компьютера ячейки виртуальной памяти состоят не из _________________________________________________________ Работа выполнена при финансовой поддержке гранта международного фонда «Human Capital Foundation» (http://hcfoundation.ru). 1 213 битов, а из тритов, принимающих три значения (0 и ±1). Подобно ячейкам компьютерной памяти, виртуальные ячейки содержат одинаковое число разрядов. Однако число разрядов виртуальной памяти зависит от изображения и, вообще говоря, превышает число разрядов в исходном компьютерном представлении, например, вдвое. Подобно тому, как биты объединяются в битовые плоскости, триты поразрядно составляют «каналы» виртуальной памяти. Триты виртуальной памяти разделяются на переменные (readwrite), значения которых можно модифицировать подобно значениям битов, и фиксированные (read-only), значения которых можно только читать (таблица). Таблица. Единицы представления и запоминания информации изображения Единицы Биты Триты Атрибуты Номер разряда 0,1.2, …, 7 0,1.2, …, Ch (канала) Состояние 0, 1 0, ±1 Статус RW R, RW Здесь Ch — число каналов виртуальной памяти изображения, R и RW — обозначения фиксированных и переменных запоминающих элементов. Разделение тритов на переменные и фиксированные выполняется так, что сохранение последних при произвольном изменении переменных тритов обеспечивает восстановление изображения в некотором упрощенном (сегментированном) виде. По визуальному восприятию допустимо считать, что фиксированные триты содержат коды явной, видимой информации, а переменные триты содержат информацию, которая менее заметна. Триты с нулевыми значениями относятся к фиксированным. Для переменных тритов определяется две операции — изменение значения трита на противоположное и преобразование переменного трита в фиксированный. Модификация тритов виртуальной памяти отображается соответствующими преобразованиями яркостей пикселов изображения. Модификация переменных тритов поддерживает запись в виртуальную память заданного троичного «сообщения» из 0 и ±1, нулевые триты которого при чтении информации обозначают неопределенное значение, сопоставляемое фиксированным тритам, а при записи трактуются как команда преобразования переменного трита в фиксированный. Модель виртуальной памяти Для построения виртуальной памяти шкала яркости по обобщенному алгоритму дихотомии [2] итеративно разбивается на диапазоны так, чтобы в каждый диапазон очередного разбиения попадало приблизительно равное число пикселов. При этом, если рассматривать яркость данного пиксела, то на каждом шаге к ней приближается одна из границ диапазона, который содержит эту яркость (рис. 1). i-я ячейка виртуальной памяти −1 1 −1 1 0 Шкала яркости Яркость i-го пиксела Номер разбиения шкалы яркости Рис. 1. Вычисление ячейки виртуальной памяти При каждом разбиении шкалы яркости на диапазоны вычисляются триты очередного разряда. Если яркость данного пиксела изображения при разделении рассматриваемого диапазона оказывается в числе больших яркостей, то соответствующему триту виртуальной памяти приписывается положительное значение, если оказывается в числе меньших, то отрицательное. Для единственной яркости вырожденного (неделимого) диапазона значение трита виртуальной памяти полагается нулевым. Для изменения значения трита на противоположное яркость пиксела замещается яркостью из альтернативного диапазона. К фиксированным относят 214 триты, которые сопоставляются пикселам с граничными яркостями, а остальные триты считаются переменными. Для фиксирования («прошивания») значения трита в данном разряде виртуальной памяти яркость пиксела замещается одной из граничных яркостей соответствующего диапазона. Количество информации, содержащейся в данном пикселе изображения, определяется числом переменных тритов, т.е. объемом сообщения, которое можно записать в ячейку виртуальной памяти данного пиксела изображения. При преобразовании переменных тритов в фиксированные количество информации в ячейках виртуальной памяти падает, а на изображении уменьшается число пикселов различной яркости. Запись кодов информации в переменные триты виртуальной памяти осуществляется последовательно — от старших каналов к младшим. При этом запись сообщения в очередной канал виртуальной памяти не влияет на информацию в предыдущих каналах, но изменяет используемое разбиение шкалы яркости и нарушает информацию в последующих каналах. Поэтому формирование требуемого сообщения в каждом канале сопровождается восстановлением кодов информации в последующих каналах, и для заполнения переменных тритов виртуальной памяти желаемыми значениями запись сообщения в очередной канал с восстановлением информации в последующих каналах повторяется до достижения точного предела, когда изображение и виртуальная память не перестают меняться. Экспериментальные результаты Результаты вычисления представления информации стандартного изображения в виртуальной памяти, а также представления количества информации (в котором амплитудные значения пикселов пропорциональны числу переменных тритов) показаны на рис. 2. Рис. 2. Инвариантные информационные представления изображения. В центре — изображение. Слева — представление информации, справа — представление количества информации (нормализованы) Представление информации является инвариантным, поскольку не меняется при растяжении, упаковке по яркости и др. изоморфных преобразованиях изображения с сохранением порядка яркостей. Взятое в качестве исходного изображения, оно не меняется также при повторном преобразовании в представление информации (преобразование идемпотентно) и с точностью до изоморфного преобразования совпадает с исходным изображением (представление изоморфно изображению по яркостному порядку). Представление количества информации вычисляется по представлению информации и помимо изоморфных преобразований сохраняется также при преобразовании изображения из «позитива» в «негатив». Оно может использоваться для выделения объектов посредством порогового преобразования подобно изображению в исходном или инвариантном представлении, что иллюстрируется в докладе на примере обработки картографических данных. Кроме того, пороговое преобразование представления количества информации задает генерацию изображения с требуемым снижением количества информации в любых пикселах изображения, которое выполняется посредством фиксирования тритов виртуальной памяти и обеспечивает выделение объектов в информационных представлениях изображения (рис. 3). 215 Рис. 3. Управление распределением количества информации. Слева — изображение; в центре — изображение с редуцированным количеством информации (вне круга); справа — представление количества информации (в негативе) В качестве доступного примера приложения модели в области защиты информации имеет смысл рассмотреть стеганографическую защиту обычных денежных знаков (рис. 4). Рис. 4. Встраивание сообщения в цифровую виртуальную память. Верхний ряд: изображение (слева) и сообщение в младшем разряде виртуальной памяти (справа); нижний ряд: изображения в старших разрядах На рис. 4 в левом верхнем углу показано изображение денежной купюры со встроенным сообщением (сегментированным изображением рис. 2) Для индивидуальной защиты купюр без создания специальной базы данных имеет смысл в качестве сообщения записывать в виртуальную память при печати изображения структурные признаки физического носителя данных (картину волокон бумаги, включений и пр.), чтобы «привязать» изображение к конкретному физическому носителю. Помимо упомянутых примеров в докладе обсуждаются и другие приложения модели. Заключение В докладе мы обосновываем общедоступное понимание информации — как последовательности символов, кодов, «следов» или иных «отпечатков», которые можно записать на бумаге, в памяти компьютера или ином физическом носителе информации, а также в виртуальной памяти изображения. Интерпретацию понятия информации мы строим в рамках комбинаторного подхода А. Н. Колмогорова, который подчеркивал, что понятие информации не обязательно связывать с понятием вероятности [3]. Количество информации мы оцениваем в соответствии со структурным подходом к информации Ф. Е. Темникова [4, 5], в котором оно сводится к подсчету структурных элементов сигнала. Идея «сконструировать» троичную виртуальную память из компонент изображения неожиданна. Однако то, что для обработки цифровой информации эффективно использовать именно троичную память, благодаря Н. П. Брусенцову известно почти полвека [6,7]. Возможно, модель сигнала с троичной памятью окажется полезной для более полного раскрытия преимуществ известных решений. Список литературы 1. I.B. Gurevich The Descriptive approach to Image Analysis. Next Steps // Pattern Recognition and Image Analysis: New Information Technologies (PRIA–7–2004) / Proc. of the 7-th. Int. Conf., St.Petersburg, - 18-23 October 2004. 2. М.В. Харинов Запоминание и адаптивная обработка информации цифровых изображений / Под ред. Р.М. Юсупова. - СПб.: Изд-во С.Петерб. ун-та, - 2006. - 138 с. 3. А.Н. Колмогоров Три подхода к определению понятия «Количество информации» // Проблемы передачи информации. - 1965. - Вып.1, том 1. С. 3-8. 4. Ф.Е. Темников Информатика // Известия вузов. Электромеханика. - 1963. - № 11. - C. 1277. 5. Ф.Е. Темников, В.А. Афонин, В.И. Дмитриев Теоретические основы информационной техники. - М.: Энергия, - 1979. - 512 с. 6. Н.П. Брусенцов Вычислительная машина "Сетунь" Московского государственного университета. В кн.: Новые разработки в области вычислительной математики и вычислительной техники. - Киев, - 1960. - С. 226–234. 7. Н.П. Брусенцов . Реставрация логики. -М.: Новое тысячелетие, - 2005. - 165 с.