Семантическая классификация JPEG изображений Результаты экспериментального исследования ЛЭТИ'2006 1 Что такое семантика? • Семантика дает ответ на вопрос: Что изображено на картинке? • В рамках данного исследования семантика определяется двумя понятиями: • Концепт (Concept) – существительное • Модификатор (modifier) – прилагательное • например: «Лесная река» ЛЭТИ'2006 2 Принципы построения алгоритма семантической классификации • 1. Сегментация изображения • 2. Семантическая классификация сегментов по прецедентам • 3. Нечеткое статистическое отношение: семантика сегмента – семантика образа • 4. Дублирующая семантическая классификация ЛЭТИ'2006 3 Формирование базы данных • На этапе накопления базы данных, для каждого сегмента и каждого образа оператор вводит концептуальные понятия (concept) и определения к ним (modifier) в виде текстовых слов. Эта пара слов считается семантикой изображения или его сегмента. • Вместе с семантикой в базе данных сохраняется набор количественных признаков ЛЭТИ'2006 4 JPEG- кодирование изображений ЛЭТИ'2006 5 Цветовое пространство R, G, B 0,255 ЛЭТИ'2006 6 Косинусное преобразование 2 x 1 i 2 y 1 j 1 7 7 Ck i, j f k x, y cos cos , 4 x 0 y 0 16 16 1 7 7 Ck 0, 0 f k x, y , 8 x 0 y 0 i, j 0, ЛЭТИ'2006 i, j 0, k 1,2,3 7 Первичные информативные признаки DCf k Ck 0,0 . • Цветовой фон k 1,2,3 • Вариабельность цветности ACf k 7 7 C i, j i 1 j 1 2 k • Цветовой контраст 1 ACf k Cont k 2 DCf k ЛЭТИ'2006 8 Сегментация изображений 3 L xi yi / Di • Мера различия векторов i 1 h1 h2 hi 1 hi 0.85 h3 ЛЭТИ'2006 9 Пример сегментации ЛЭТИ'2006 10 Признаковое пространство сегмента • • • • Относительная площадь Позиция сегмента в поле изображения Доминирующий фон Вариабельность цветности: 1 aYCbCr i S ACf i ЛЭТИ'2006 2 s 11 Полигон сегмента cont k k 1,2,,14 ЛЭТИ'2006 12 Характеристики полигона • • • • • • • Относительная площадь Относительный диаметр Фактор формы Угол ориентации диаметра Координаты центра масс Координаты геометрического центра Угол ориентации главной компоненты ЛЭТИ'2006 13 Полигон изображения cont k k 1,2,,21 ЛЭТИ'2006 14 Информативность признаков x y a 0 m00 1 m10 2 3 4 m40 n0 b m01 m11 m41 n1 c m02 n2 d m03 n3 e m04 n4 f m05 n5 g m06 h m07 n6 n7 mi mi H x log M i M m0 m1 m2 m3 m4 M H y j H x M H x y H x: y H x H y H x y S x: y H x: y * 2 nj i j log mij M nj M log Hy ЛЭТИ'2006 15 mij M Агрегирование признаков Признаки полигона Одиночный признак Сложный признак FormFactor 0.659 0.8719 EFactor 0.677 Potential 0.673 Radius 0.651 Mass_center (y) 0.637 Polygon_center (y) 0.643 i 0.9222 ЛЭТИ'2006 16 Нечеткая классификация • Уровень достоверности признака i 1 min d ki max d ki k k • Функция принадлежности к прецеденту 1 p k min i , i p i 1 • Функция принадлежности к семантике s max k k K s ЛЭТИ'2006 17 Нечеткая классификация образов по семантике сегментов n 1 Im i s k Transit i, k n m i k 1 n - число сегментов в образе Transit - матрица нечеткого отношения между семантикой сегментов и семантикой образов. ЛЭТИ'2006 18 Нечеткая классификация образов по параметрам полигона образа • Уровень достоверности признака i 1 min d ki max d ki k k • Функция принадлежности к прецеденту g 1 k min i , i g i 1 • Функция принадлежности к семантике s max k k K s ЛЭТИ'2006 19 Комплексирование результатов min Im , p ЛЭТИ'2006 20 Моделирующая программа ЛЭТИ'2006 21 Характеристика базы данных Число примеров =100 Число сегментов =535 Число концептуальных понятий =86 Число модификаторов понятий =154 Число сочетаний Concept/Мodifier на уровне сегментов=214 Число сочетаний Concept/Мodifier на уровне образов=67 Средний размер изображений 120*120 пикселов ЛЭТИ'2006 22 Эксперимент 1 Паттерн ЛЭТИ'2006 23 Эксперимент 2 Паттерн ЛЭТИ'2006 24 Публикации • Дорогов А.Ю., Курбанов Р.Г., Разин В.В • Быстродействующий алгоритм семантической классификации JPEG– изображений. • Электронный журнал «Нейроинформатика» 2006, том 1, № 2 с.124-144. http://www.ni.iont.ru/Journal/N2/ ЛЭТИ'2006 25