Поиск изображений.
Синтез различных методов поиска при
формировании результатов.
Наталья Васильева
Александр Дольник
Илья Марков
Санкт-Петербургский Государственный Университет
Интернет-Математика 2007
Синтез данных в контексте CBIR
цвет (2)
цвет
аннотации
текстура
 Комбинированный поиск
(различные характеристики)
 Уточнение результатов
поиска (разные алгоритмы)
 Дополнение результатов
поиска (разные множества)
Интернет-Математика 2007
синтез
результат
форма
Поиск в частично аннотированной базе
поиск по
аннотациям
TextResult1, textrank1
TR2, tr2,
...
по содержанию
Текстовый запрос
tr1
…
tr2
…
…
Интернет-Математика 2007
Результат
Синтез ранжированных списков с весами
ωi – вес i-го списка; rik - ранг k-го элемента в списке i
ω1
(x11, r11), (x12, r12), … , (x1n, r1n)
ω2
(x2
1,
r2
1),
(x2
2,
r2
2),
…,
(x2
n,
r2
n)
…
ωm
r0k = f(Ω, Rk), где
Ω – множество весов всех списков,
Rk - множество рангов элемента k
(xm1, rm1), (xm2, rm2), … , (xmn, rmn)
Существующие решения:





CombMax, CombMin, CombSum
CombAVG
CombMNZ = CombSUM * number of nonzero similarities
ProbFuse
HSC3D
Интернет-Математика 2007
Свойства функции синтеза
1) Симметричность
2) Монотонность по каждому из аргументов
3) Функции для определения ранга объекта
Функция ранга ([0..1], [0..1])N -> [0..1]
Функция веса [0..1]N -> [0..1]
4) MinMax условие /CombMin, CombMax, CombAVG/:
min{ rx(1 ) , rx( 2 ) ,..., rx( N ) }  rx( 0)  max{ rx(1 ) , rx( 2 ) ,..., rx( N ) }
5) Дополнительное свойство (аналог HSC3D):
условие взвешенной стабилизации элементов с высоким рангом
(правило конусов)
Интернет-Математика 2007
Weighted Total with Gravitation Function
Модернизация CombAVG, в качестве веса - стабилизационная
(гравитационная) функция:
где
Интернет-Математика 2007
Эксперименты: метод оценки
Параметры Roverlap, Noverlap:
Roverlap ( x) 
M  R ( 0) ( x)
M
R
( i )
N overlap ( x) 
( x)
M  N ( 0) ( x)
M
( i )
N
 ( x)
i
i
Lee J. H. Analyses of multiple evidence combination. SIGIR '97: Proceedings of the 20th annual
international ACM SIGIR conference on Research and development in information retrieval.
New York, NY, USA: ACM Press, 1997. – P. 267-276.
Интернет-Математика 2007
Описание эксперимента I
Данные:
Коллекция Flickr (~15000)
Методы:




Random с условиями MinMax
CombMNZ
WTGF_MT
WeightedTotal
Интернет-Математика 2007
Результаты эксперимента I: Roverlap
а) Зависимость Roverlap от размера списка
при delta=0.03 для 10 входных списков
б) Зависимость Roverlap от размера списка
при delta=0.07 для 10 входных списков
Интернет-Математика 2007
Результаты эксперимента I: Noverlap
а) Зависимость Noverlap от размера списка
при delta=0.03 для 10 входных списков
б) Зависимость Noverlap от размера списка
при delta=0.07 для 10 входных списков
Интернет-Математика 2007
Описание эксперимента II
Данные:
Коллекция Corel Photo Set (285)
Участники синтеза (попарное смешивание):
 цветовые гистограммы с пространственной информацией (СolorHist )
 статистическая характеристика цвета (СolorHist )
 текстурная характеристика на основе фильтров ICA (ICAHist)
Методы:
 CombMNZ
 WTGF_MT
 WTGF_MT_weighted
Интернет-Математика 2007
Результаты эксперимента II
Графики зависимости значений Roverlap от размера списков для различных функций
синтеза применительно к различным методам поиска по содержанию:
а) ColorHist и ColorMoment; b) ColorHist и ICAHist; c) ColorMoment и ICAHist.
Интернет-Математика 2007
Выводы
 Методы синтеза применимы к задаче поиска изображений и
позволяют существенно улучшить результаты поиска.
 WTGF:
- большое количество источников;
- невысокая степень перекрытия источников;
- источники с различными весами.
 CombMNZ:
- равнозначные источники;
- высокая степень перекрытия источников.
 Предложенная схема поиска по частично аннотированной базе
оправдала себя.
Интернет-Математика 2007
Скачать