80 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ АЛГОРИТМОВ КОМПРЕССИИ ИЗОБРАЖЕНИЙ НА ОСНОВЕ НЕРАЗДЕЛИМЫХ ОБОБЩЕННЫХ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЙ ХААРА1 А.М. Белов2 систем обработки изображений РАН; 443001, ул. Молодогвардейская, 151, Самара, Россия; +7 (8462) 3378084, [email protected] 2Институт В работе описаны алгоритмы компрессии цифровых изображений на основе неразделимых двумерных вейвлет-преобразований на непрямоугольных носителях. Также представлены экспериментальные исследования эффективности этих алгоритмов и их сравнение с алгоритмом компрессии на основе разделимого вейвлет базиса Хаара. 1 Введение ства Q образующего интегральное самопо- В настоящее время вейвлет-преобразование широко применяется в обработке изображений, в частности, в задачах компрессии цифровых изображений. Большинство вейвлетов, используемых в обработке изображений являются разделимыми, т.е. двумерное преобразование представляет собой суперпозицию двух одномерных. Это влечет появление различных артефактов на изображении, включая блочные и линейные, к которым зрительная система человека наиболее чувствительна [7]. В связи с этим, возникает вопрос о необходимости, разработки методики построения неразделимых вейвлет базисов. В работе [3] был рассмотрен вопрос о конструировании многомерных неразделимых аналогов базиса Хаара. Такой вейвлет базис был определен, как вейвлет базис над L2 (R n ) с компактным носителем, соответствующий кратномасштабному анализу порожденному масштабирующей функцией вида, где Q (x ) характеристическая (индикаторная) функция компактного множе- добное покрытие R n . Построение таких преобразований, а именно отыскание масштабирующей функции является довольно сложной задачей, что затрудняет использование этого метода. В работах [7, 8] был предложен метод построения таких вейвлет базисов над L2 (R 2 ) с использованием систем счислений, основаниями которых являются целые гауссовы числа. В работе [2] было представлено обобщение метода построения неразделимых двумерных вейвлет-базисов Хаара. Такое обобщение стало возможным после разработки венгерскими математиками Катаем и Ковачем теории канонических систем счисления (КСС) в квадратичных полях [4, 5, 6]. Следует отметить, что кроме простоты построения базиса, такое обобщение может быть мотивировано необходимостью выбора наиболее подходящего вейвлет-базиса. В работе даны теоретические сведения о канонических системах счисления, об обобщенных вейвлетах Хаара, описана общая идея алгоритмов компрессии цифровых изображений на основе таких вейвлет- Работа выполнена при поддержке РФФИ (гранты № 07-07-97610-р_офи, 06-01-00722-а); в рамках программы фундаментальных научных исследований ОИТВС РАН "Новые физические и структурные решения в инфотелекоммуникациях", проект "Разработка новых методов и алгоритмов кодирования изображений в инфотелекоммуникационных системах реального времени"; в рамках российско-американской программы "Фундаментальные исследования и высшее образование" (CRDF Project RUX0-014-SA-06); 81 базисов. Представлены экспериментальные исследования эффективности алгоритмов компрессии на основе таких вейвлетбазисов в сравнении с алгоритмом компрессии на основе разделимого вейвлетбазиса Хаара. Рассмотрена целесообразность адаптивного выбора вейвлет базиса, с целью повышения качества компрессии. Канонические системы счисления в квадратичных полях Пусть Q( d ) есть квадратичное поле Q( d ) z a b d ; a, b Q , d Z , свободно от квадратов. В работе рассматриваются только мнимые квадратичные поля, т.е. d 1. Определение 1. Если для элемента z a b d Q( d ) норма и след – целые числа: Norm( z) a 2 db 2 Z, Tr ( z ) 2a Z, то элемент называется целым алгебраическим числом поля Q ( d ) . Целое алгебраическое число z a b d называется целым гауссовым числом, если a, b Z . В работах [5], [6] введено понятие канонической системы счисления в кольце S ( d ) целых элементов поля Q ( d ) . Целое алгебраическое число называется основанием канонической системы счисления в кольце целых поля Q ( d ) , если любой целый элемент поля однозначно представим в форме конечной суммы: z k ( z) z j j , j 0 где z j D 0,1,, Norm( ) 1. Пара ( , D) называется канонической си- Фундаментальной областью T ( , D ) C КСС ( , D) в кольце S ( d ) целых элементов поля Q ( d ) , называется множество комплексных чисел с нулевой целой частью, т.е: T ( , D) 1 d j j , d j D . j Пусть a a0 , a1 – пара линейно независимых векторов пространства R 2 . Линейная оболочка с целыми коэффициентами векторов a0 , a1 называется решеткой над R 2 с базисом a a0 , a1 . : 0a0 1a1 , 0,1 Z . Решетки S ( d) над кольцами целых алгеб- раических чисел S ( d ) порождаются базисами: 1) a (1,0), (0, d ) , при d 2,3(mod 4) ; 1 d ) , при d 1(mod 4) , 2) a ( ,0), (0, 2 2 компоненты 0 и 1 элементов решетки имеют одинаковую четность. Обобщенные вейвлет-базисы Хаара В работе [4] предложен метод построения обобщенных вейвлет-базисов Хаара: Для любой КСС ( , D) в кольце S ( d ) существует КМА, ассоциированный с парой (S( d ) , A) , и функция T ( , D ) является масштабирующей функцией этого КМА и: 1) функции вейвлет-базиса определяются равенством: q i ui 1, j1,d j , стемой счисления в кольце S ( d ) целых j 1 поля Q ( d ) . где u i , j - элементы унитарной матрицы U , Для представления числа z S ( d ) в КСС ( , D) часто используют, так называемую позиционную запись этого числа (адрес числа): z ( zk ( z ) , zk ( z )1 z0 ) , где z j D . в которой u1, j q 1 / 2 , j 1 q , ui , j (i 1)( 2 j 1) 2 cos q 2q , 82 где i 2 q , j 1 q , d j D , q det A ; 2) коэффициенты фильтра для преобразования с базисом i определяются равенствами: h j u1, j , j 1 q , g ij ui , j , i 2 q , j 1 q . Основная идея алгоритмов вейвлетдекомпозиции, на основе описанных выше базисов, базируется на интерпретации точек двумерной целочисленной решетки (растра изображения) как элементов кольца целых алгебраических чисел квадратичного поля, т.е. осуществляется переход от двумерной целочисленной решетки Z к решетке целых алгебраических чисел S ( d ) некоторого квадратичного поля. После такого перехода, двумерная индексация отсчетов исходного сигнала, заменяется одномерной, в силу существования отображения множества целых алгебраических чисел (по сути двумерных точек) на множество адресов этих чисел, что позволяет интерпретировать отсчеты изображения как точки фундаментальной области КСС. Такой подход предполагает два варианта: исходный сигнал полностью покрывается фундаментальной областью КСС, либо ее фрагментом. В работе [1] предложены и подробно описаны алгоритмы декомпозиции и реконструкции исходного сигнала для двух рассмотренных случаев. Для первого случая предложен алгоритм с полным деревом декомпозиции (FDT), для второго случая - алгоритм с частичным деревом декомпозиции (PDT). На основе предложенных алгоритмов декомпозиции и реконструкции были реализованы алгоритмы компрессии и декомпрессии цифровых изображений. Основная идея этих алгоритмов заключается в наложении фундаментальной области некоторой КСС на исходное изображение и последующей декомпозиции по адресам точек этой фундаментальной области. Экспериментальные исследования В этом разделе представлены результаты экспериментов и сравнительный анализ предложенных алгоритмов с алгоритмом компрессии на основе разделимого вейвлет-базиса Хаара. Качество алгоритмов оценивалось по следующим параметрам: пиковое соотношение сигнал/шум (PSNR), коэффициент компрессии (kc), и визуальное качество восстановленной аппроксимации изображения. На примере текстурных изображений была исследована эффективность предложенного подхода к адаптивному выбору вейвлетбазиса. Исследовалась выборка из 130 полутоновых текстурных изображений размером 512 512 пикселей, из атласа «Brodatz». По этому множеству изображений были вычислены параметры PSNR и для kc следующих алгоритмов: FDT ( 1 i ) , FDT (i 2 ) , FDT (1 i 3 ) и Haar, при ширине интервала квантования 10 . Эксперименты показали, что исходная выборка изображений может быть разбита на 4 класса, в каждом из которых наиболее эффективен только один из алгоритмов. Распределение исходной выборки по классам представлено в таблице 1. Таблица 1. Распределение исходной выборки по классам Число изображений 60 Процентное соотношение 46% K FDT ( 1 i ) 13 10% K FDT (i 41 32.5% 16 11.5% Класс K Haar 2) K FDT ( 1 i 3) Исследования показали, что рассмотренные алгоритмы эффективны в «своих» классах изображений при различных значениях ширины интервала квантования. Численные значения, на примере класса K FDT (i 2 ) представлены в таблице 2. 83 Заключение Таблица 2. Средние значения PSNR и kc для класса изображений K FDT (i 2 4 6 8 10 12 14 16 18 20 Haar PSNR 45,3982 41,37 38,389 36,3564 35,0026 33,6814 32,6728 31,772 31,0288 30,3278 kc 1,6258 2,1366 2,5952 3,001 3,3186 3,664 3,9614 4,2558 4,5294 4,8106 2) FDT (i 2 ) PSNR 46,603 41,7622 38,5862 36,394 34,9308 33,8362 32,8332 31,9276 31,1544 30,4278 kc 1,6414 2,1666 2,6786 3,1402 3,5082 3,8328 4,143 4,4528 4,757 5,0492 На рисунке 1 представлены фрагменты восстановленных аппроксимаций изображения для алгоритмов В работе описаны алгоритмы компрессии цифровых изображений на основе обобщенных вейвлет-базисов Хаара. Показана эффективность адаптивного выбора таких вейвлет-базисов в целях повышения качества решения задачи компрессии, представлено сравнение с алгоритмом компрессии на основе разделимого вейвлет-базиса Хаара. Также показана эффективность использования таких вейвлет-базисов, с точки зрения повышения визуального качества восстановленных изображений. Список литературы 1. 2. 3. 4. а б 5. 6. 7. в г Рисунок.1. Исходное изображение (а), восстановленные изображения для алгоритмов Haar (б), FDT (1 i ) (в), FDT ( 3 i 7 ) (г) 2 Как видно из представленных иллюстраций, использование обобщенных вейвлетов Хаара в задаче компрессии позволяет повысить визуальное качество восстановленных аппроксимаций изображений, за счет того, что артефакты имеют непрямоугольную сложную конфигурацию, и менее заметны для зрительной системы человека. 8. Белов А.М. "Алгоритмы декомпозиции сигнала на основе неразделимых вейвлетпреобразований Хаара" //Компьютерная оптика. – Самара - Москва, ИСОИ РАН, СГАУ, 2007. – Том 31, № 1. С. 63 – 66. Белов А.М. "Применение канонических систем счисления в задаче построения неразделимых хааро-подобных вейвлетов" //Компьютерная оптика, №28, Самара - Москва, 2006 г., с. 119 – 123. Grochenig K., Madych W.R. Multiresolution Analysis, Haar Bases, and Self-Similar Tilings of Rn // IEEE Trans. Inform. Theory, 1992, 38, pp. 556 568. Katai I., Kovacs B. Canonical number systems in imaginary quadratic fields // Acta Math. Acad. Sci. Hungaricae, 1981, 37, pp. 159 - 164. Katai I., Szabo J. Canonical number systems for complex integers // Acta Sci. Math.(Szeged), 1975, 37, pp. 255 - 260. Kovacs A. Generalized binary number systems. Annales univ. Sci. Budapest, Sect. Comp. 2001, 20, pp. 195-206. Mendivil F., Piché D. Two Alghoritms for NonSeparable Wavelet Transforms and Applications to Image Compression, Fractals: Theory and Applications in Engineering, Springer-Verlag, 1999. Piché D.G. Complex Bases, Number Systems and Their Application to Fractal-Wavelet Image Coding // PhD in Applied Mathematics thesis. Ontario, Canada: University of Waterloo, 2002.