ПРОБЛЕМА ОЦЕНИВАНИЯ ПО МАЛОМУ ЧИСЛУ НАБЛЮДЕНИЙ

advertisement
ПАРАЛЛЕЛЬНАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ
Фурсов В.А., Попов С.Б.
Самарский научный центр РАН,
Самарский государственный аэрокосмический университет,
Институт систем обработки изображений РАН
План доклада
1.
2.
3.
4.
5.
6.
7.
8.
Состав вычислительного ядра Центра.
Создание вычислительных сервисов.
Научные задачи, решаемые с применением высокопроизводительных
вычислительных ресурсов.
Постановка задачи параллельной фильтрации.
Исследование эффективности параллельной реализации.
Проблема выбора и оценивания параметров модели.
Вычислительные аспекты оценивания по малому числу наблюдений.
Общие проблемы и перспективы параллельных вычислений.
АРХИТЕКТУРА ОБЪЕДИНЕННОГО КЛАСТЕРА
СГАУ, СНЦ РАН, ИСОИ РАН
ЦЕНТР ВЫСОКОПРОИЗВОДИТЕЛЬНОЙ ОБРАБОТКИ
ИНФОРМАЦИИ САМАРСКОГО НАУЧНОГО ЦЕНТРА РАН
•ТЕХНИЧЕСКИЕ
ХАРАКТЕРИСТИКИ,
ДОСТИГНУТЫЕ В 2002 г.
•ЧИСЛО ПАРАЛЛЕЛЬНО
РАБОТАЮЩИХ
ПРОЦЕССОРОВ - 24
•СКОРОСТЬ ОБМЕНА
ДАННЫМИ МЕЖДУ
ПРОЦЕССОРАМИ
1,28 млрд. двоичных
единиц в секунду
•ОБЩАЯ (ПИКОВАЯ)
•ПРОИЗВОДИТЕЛЬНОСТЬ
20,5 млрд. операций в
секунду
САМАРСКАЯ СЕТЬ НАУКИ И ОБРАЗОВАНИЯ
ВЫЧИСЛИТЕЛЬНЫЙ СЕРВЕР ДЛЯ НАУЧНЫХ
ИССЛЕДОВАНИЙ И ОБРАЗОВАНИЯ
Типовой сценарий работы
пользователя в среде
1. Обращение к серверу
2. Регистрация пользователя
3. Вход в систему
4. Задание параметров рассчитываемого
элемента
5. Расчет элемента на сервере
НАУЧНЫЕ ЗАДАЧИ, РЕШАЕМЫЕ С ИСПОЛЬЗОВАНИЕМ
ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ РЕСУРСОВ ЦЕНТРА
«…развитие математики в определенный период времени отражает
природу вычислительных средств, доступных в этот момент, в
значительно большей степени, чем можно было бы предположить.»
Т. Тоффоли, Н. Марголус. Машины клеточных автоматов, М.: Мир,19991 г.,
стр. 152.
Задачи дифракционной оптики и обработки изображений:
1. Решение уравнения Максвелла
2. Обработка (фильтрация) изображений
3. Фрактальное кодирование изображений
4. Обучение алгоритмов распознавания (нейронных сетей)
КЛАСТЕРНАЯ ТЕХНОЛОГИЯ ПАРАЛЛЛЕЛЬНОЙ
ОБРАБОТКИ (ФИЛЬТРАЦИИ) ИЗОБРАЖЕНИЙ
1. Разностное уравнение, описывающее линейный фильтр
g n1 , n2   
a




m1 , m2 Qg
m1 , m2
g (n1  m1 , n2  m2 ) 
b




m1 , m2 Q f
m1 , m2
f (n1  m1 , n2  m2 )
2. Итерационная схема реализации фильтра
Yi (e1 , e 2 )  A(e1 , e 2 ) X (e1 , e 2 )  C (e1 , e 2 )Yi 1 (e1 , e 2 )
C (e1 , e 2 )  1  B(e1 , e 2 ) 0    2 / max B(e1 , e2 )

Aˆ z1 , z 2   aˆ 0 [1  aˆ1 z1  z11  z 2  z 21


 aˆ 2 z1 z 2  z11 z 21  z1 z 21  z11 z 2 ],


(1 ,2 )
Bˆ z1 , z 2   1  bˆ1 z1  z11  z 2  z 21
 bˆ z z  z 1 z 1  z z 1  z 1 z .
2

1 2
1
2
1 2
1
2


СХЕМА РАСПАРАЛЛЕЛИВАНИЯ ПО ДАННЫМ
СХЕМА ПАРАЛЛЕЛЬНОЙ ОБРАБОТКИ
НА ЧЕТЫРЕХ ПРОЦЕССОРАХ
Node 0
Get Image
Node 1
Node 2
Node 3
Send Frame 3
Send Frame 1
Get Frame
Get Frame
Send Frame 2
Get Frame
Frame Processing
Frame Processing
Frame Processing
Frame Processing
Frame Swapping
Frame Swapping
Frame Swapping
Frame Swapping
Send Frame
Get Frame 1
Get Frame 2
Get Frame 3
Save Image
Send Frame
Send Frame
ЗАВИСИМОСТЬ ВРЕМЕНИ ОБРАБОТКИ ИЗОБРАЖЕНИЯ
ОТ КОЛИЧЕСТВА ПРОЦЕССОРОВ
200
180
160
140
120
100
80
0
2
4
6
8
10
12
14
16
Тестовое изображение 40964096
Кластер: Узлы - Pentium, Сетевая технология – Fast Ethernet, платформа Linux
ПРИМЕР ОБРАБОТКИ УЧАСТКА ИЗОБРАЖЕНИЯ
ПРИМЕР ВЫДЕЛЕНИЯ ФРАГМЕНТА НА ИЗОБРАЖЕНИИ
ДЛЯ РЕШЕНИЯ ЗАДАЧИ ОЦЕНИВАНИЯ ФИЛЬТРА
Исходный
фрагмент
«Отретушированный»
фрагмент
ПРОБЛЕМА ОЦЕНИВАНИЯ ПО МАЛОМУ
ЧИСЛУ НАБЛЮДЕНИЙ
y  Xc  ξ
Задача:
Условие малого числа наблюдений:
dim N ( XT ) N  M

1
dim R X 
M
Проблемы:
1. Априорная неопределенность информативных свойств матрицы X.
2. Свойство устойчивости статистических характеристик
не выполняется в полной мере .
Предположения:
1. Матрица X и вектор y известны в результате измерений.
2. Статистические характеристики вектора ошибок не известны
3. Вектор ошибок ограничен:

ξ  Ξ, Ξ  ξ : ξ ξ   ξ 2  R  Const
T
1
2

ФОРМУЛИРОВКА ПРИНЦИПА
СОГЛАСОВАННОСТИ ОЦЕНОК
Предполагается, что существует точная модель
y*  X * c
Из исходной системы формируется множество 
подсистем меньшей размерности
yL  X L c  ξ L
Для каждой подсистемы вычисляется оценка и на множестве  ищется
подмножество подсистем, в котором оценки, наиболее согласованы в
смысле заданного критерия
Проблемы:
1. Как строить множество 
2. Как задавать критерии вычисления оценок и формирования
подмножеств?
3. Существует ли и для каких критериев единственная оценка?
ЧАСТНЫЙ СЛУЧАЙ ФОРМУЛИРОВКИ
ПРИНЦИПА СОГЛАСОВАННОСТИ ОЦЕНОК
1. Множество  задается в виде подсистем размерности M<L<N,
сформированных из строк исходной системы
y  Xc  ξ
(1)
взятых во всех возможных сочетаниях.
2. Для каждой системы из множества , в свою очередь, строится
множество подсистем размерности MP<L, сформированных из ее
строк во всех возможных сочетаниях.
3. Критерий согласованности (взаимной близости):
Wl ĉ l ,q    cˆq,i  ci
M
где
cˆq,i
Q
i 1 q 1
,
(2)
оценка i-й компоненты для q-й подсистемы l-й системы из
множества 
ВЫЧИСЛИТЕЛЬНЫЕ АСПЕКТЫ РЕАЛИЗАЦИИ
ПРИНЦИПА СОГЛАСОВАННОСТИ ОЦЕНОК
1.Применение переборных алгоритмов
2.Высокая вычислительная сложность.
3.Необходимость применения высокопроизводительных
многопроцессорных систем.
Пример:
1.Строится K вариантов подсистем (M<K<N) и ищется
соответствующая ей оценка



c : Q c  min  Q c
q
 
q
i K
 i
Число вариантов при N=8, M=4, k=6:
C86 * C64  28 * 15  420
.
При построении вариантов всех возможных размерностей.
Увеличение размерности варианта на 1 вычислительная сложность
возрастает на величину
2(k+3)2-11
где k размерность предыдущего варианта подсистемы.
ОБЩИЕ ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ
ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛЕНИЙ
Основные проблемы:
1. Отсутствие параллельных приложений, ориентированных на
кластерную архитектуру.
2. Недостаточно высокая пропускная способность сетей.
3. Недостаток квалифицированных специалистов.
Задачи и перспективы:
1. Формирование программ поддержки разработки параллельных
приложений (по отраслям).
2. Создание сети высокопроизводительных центров распределенных
вычислений (уровня округа).
3. Целевая поддержка кафедр и циклов в университетах, ведущих
подготовку специалистов в области перспективных информационных
технологий.
4. Упорядочение статуса центров коллективного пользования, типовое
положение, схема финансирования для поддержания
функционирования.
Download