УДК 004(06) Информатика и процессы управления И.Ш. БАТУАШВИЛИ, И.В. САФОНОВ Московский инженерно-физический институт (государственный университет) СИСТЕМЫ ПОИСКА ИЗОБРАЖЕНИЙ Рассматриваются изображений. принципы работы существующих систем поиска Существует проблема организации поиска и анализа для цифровых данных произвольного типа, в частности изображений, обработка которых традиционными средствами СУБД оказывается малоэффективной. Системы поиска изображений подразделяются на 2 большие группы: поиск по информации, содержащейся в самом изображении, и поиск по метаинформации об изображении. Поиск изображений по метаинформации основан на сопоставлении изображению некоего ряда текстовых или числовых атрибутов (например, ключевых слов). Атрибуты могут извлекаться из метаданных (например, EXIF-заголовка) файлов изображений или определяться из контекста изображения. Как правило, системы поиска по метаинформации используется в www-системах поиска изображений. В таком случае контекстом изображения является набор ключевых слов, сопоставленных странице, на которой расположено изображение. В других случаях, контекстом изображения может служить условие его появления в системе, например, время регистрации изображения для систем видеонаблюдения. В крупных системах атрибуты изображений организуются в иерархические структуры, позволяющие детализировать данные об изображении на основании уже имеющихся атрибутов. Примером подобной системы служит система Iconclass [4]. В системах поиска по информации, содержащейся в самом изображении, как правило, реализуется подход поиска изображений по образцу (эталону). Различные методы анализа изображений объединены в следующие группы [1]: 1) Корреляционные методы поиска изображений; 2) Методы, использующие нормализацию изображений; 3) Методы, выделяющие признаки изображений. Корреляционные методы основаны на сравнении изображений путем прямого их совмещения с оценкой сумм интегральных разностей по всем каналам изображения. Данные методы редко применяются при поиске изображений, так как они применимы в основном только для поиска среди изображений одного класса и требовательны к вычислительным ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12 22 УДК 004(06) Информатика и процессы управления ресурсам, и, так как построить индекс изображений в данном случае невозможно (индексом является само изображение), скорость поиска линейно зависит от объема базы данных изображений, что неприемлемо уже на средних размерах базы данных. Методы нормализации при распознавании занимают промежуточное место между корреляционными и признаковыми алгоритмами. В отличие от признаковых при нормализации изображение не теряется, а заменяется нормализованным эквивалентным изображением. Алгоритмы нормализации существенно различаются для различных классов изображений, что затрудняет использование метода в общем случае. Например, нормализация изображений используется при поиске и распознавании лиц [2]. При анализе изображения при помощи операций аффинных преобразований и кадрирования образ приводится к стандартному размеру, используемому в системе, и сравнивается с сохраненными образами. Для сравнения используется интегральный критерий схожести изображений: суммарное квадратичное отклонение карт яркостей изображений. Признаковые методы наиболее разработаны в теории распознавания образов. Поиск производится на основании выделения признаков изображения, и сравнения с признаками, хранящимися в базе данных. Набор признаков может быть произвольным и варьироваться в зависимости от конкретных условий применения. Главную трудность в признаковых методах составляет определение набора признаков и их весов, при этом исходят из правил: а) признаки изображений одного класса должны различаться незначительно; б) признаки изображений разных классов должны существенно различаться; в) набор определяющих признаков должен быть минимальным возможным. Данная группа методов наиболее универсальна и дает в среднем лучший результат поиска на произвольном классе изображений по сравнению с остальными методами поиска. На основе признаковых методов поиске реализовано несколько систем поиска изображений, например, CBIR [3]. Список литературы 1. Shalkoff R.J. “Digital image processing and computer vision”, John Wiley & Sons, Inc., 1999. 2. Photobook image recognition & retrieval system: http://vismod.media.mit.edu/vismod/demos/facerec/basic.html. 3. Content-Based Image Retrieval (CBIR) System: http://www.unn.ac.uk/iidr/CBIR/report.html. 4. Iconclass image classifaction system: http://www.iconclass.nl/texts/info01.htm. ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12 23 УДК 004(06) Информатика и процессы управления ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12 24