Облачные вычисления второго поколения: интерактивные системы и семантические технологии

реклама
Облачные вычисления второго
поколения: композитные приложения,
интерактивные системы и
семантические технологии
С.В. Ковальчук, А.В. Бухановский
НИИ Наукоемких компьютерных технологий,
СПб НИУ ИТМО, Санкт-Петербург
Всероссийская конференция «Инфокоммуникационные
технологии в научных исследованиях»
Таруса – 2012
Специфика проблемы
Облачные технологии для высокопроизводительных
вычислений в научных исследованиях
1.
2.
3.
4.
5.
6.
2
Гетерогенность вычислительных ресурсов в составе облака и
использование ранее созданных сред распределенных
вычислений (от «Ломоносова» – до ГридННС).
Уникальность и разнообразие прикладных сервисов для науки и
образования (диверсификация по предметным областям).
Архитектурная привязка прикладных сервисов к вычислительной
инфраструктуре (оптимизация под инфраструктуру
разработчика).
Участие пользователей в создании и развитии новых сервисов и
композитных приложений на их основе (самоорганизация состава
облака).
Виртуальное профессиональное сообщество (устойчивая
обратная связь).
Поддержка интерактивных сервисов в «реальном» времени
(сервисы доступа к оборудованию, визуализации и пр.).
Инфокоммуникационные технологии в научных исследованиях
Эволюция облачных технологий
от виртуализации – к глобальным управляемым средам
Cloud Computing Maturity Model – CСMM
Консолидация
ресурсов
Абстракция
ресурсов
Автоматизация
использования
ресурсов
Технологии I поколения:
• Унифицированный доступ к
вычислительным и программным ресурсам
требуемой конфигурации
• Удаленное исполнение типовых приложений
• Коллективное хранение и использование
сверхбольших объемов данных
• Виртуализация (кросс-платформенность и
кросс-технологичность)
3
Распространение
Развитие
сервисов в
поддержки
облачных сервисов облаках разного
уровня
Технологии II поколения:
• Создание композитных
приложений
• Интеллектуальная поддержка
поиска и применения
сервисов
• Динамическое управление
производительностью
сервисов
• Гибкая интеграция с
системами реального времени
Инфокоммуникационные технологии в научных исследованиях
Многофункциональная инструментальнотехнологическая платформа CLAVIRE
Cloud Applications VIRtual Environment - платформа
облачных вычислений второго поколения
Предотвращение
нагонных
наводнений в СанктПетербурге
Глобальные системы
организации экстренных
вычислений
Корпоративные системы
распределенных вычислений
Исследовательское
проектирование морских судов
и объектов океанотехники
Распределенные системы
потоковой обработки
сверхбольших объемов
данных
Многопрофильная
инструментальнотехнологическая
платформа
Системы распределенных
вычислений в составе ЦОД
Поиск и анализа
информации о
террористических
угрозах
Коллаборативные предметноориентированные системы
распределенных вычислений
Моделирование развития
вирусной эпидемии и
определение эффективных
средств противодействия
Квантово-механические расчеты и моделирование атомномолекулярных наноразмерных структур и комплексов
5
Инфокоммуникационные технологии в научных исследованиях
Архитектура CLAVIRE
Реализация
концепции iPSE
(Intelligent Problem
Solving
Environment)
Абстрактное
описание сервисов
и приложений в
терминах
предметной
области, и
трансляция в
исполнимую форму
с использованием
отчуждаемых
знаний
6
Инфокоммуникационные технологии в научных исследованиях
Формализм описания пакета
Программный модуль – это
прикладная программа,
предоставляющая интерфейс для
вызова и исполнения
определенной предметной
функциональности.
Предлагается перейти к простой модели пакета,
основанной на параметрах, за счет
использования механизма абстрактных
описаний ( ):
«пакет преобразует входные параметры в
выходные».
В рамках распределенной среды пакет можно
формально представить:
7
Инфокоммуникационные технологии в научных исследованиях
Композитное приложение в виде WF
Особенности представления КП



Пример Workflow
Элементарные блоки – запуски
программных модулей;
Зависимости двух типов: по данным и
по управлению;
Использование описания пакетов в
качестве основы для проектирования.
Модель Workflow – DAG
8
Инфокоммуникационные технологии в научных исследованиях
Предметно-ориентированные языки
EasyPackage – предметноориентированный язык, основанный на
Ruby, для унифицированного описания
пакетов в декларативном виде для
обеспечения доступа к ним
распределенной среде.
В описании представлены:
EasyFlow – предметно-ориентированный
язык для унифицированного описания
композитных приложений
Особенности языка:

Основан на модели DAG;

Декларативный
(с императивной частью);

Общая информация о пакете и параметрах;

Компактное представление;

Предметные параметры: вход и выход;

Использование базовых типов данных.

Способ запуска, режимы распараллеливания,
модель производительности в виде параметров
исполнения;

Связи между параметрами, определяющие
порядок интерпретации;


Элементы языка:

Узлы — запуски пакетов;

Зависимости;
Возможности управления динамическим
определением набора параметров;

Указание значений параметров;

Варьирование параметров;
Процедуры проверки корректности
поставленной задачи.

Пост-обработка.
9
Инфокоммуникационные технологии в научных исследованиях
Создание и интерпретация
композитного приложения
Использование предметно- ориентированного языка позволяет
унифицировать описание и автоматизировать запуск композитных
приложений
Абстрактное описание Workflow (AWF)
10
Исполненный Workflow (CWF)
Инфокоммуникационные технологии в научных исследованиях
Интерактивные композитные
приложения
Области применения и задачи

Системы реального времени;

Системы взаимодействия с пользователем;

Системы поддержки принятия решений;

Системы визуализации;

Управление приложением во время
исполнения (computational steering);

Получение данных из внешних источников
(датчиков).
Схема модельного интерактивного КП
Принципы интерактивных КП:

поддержка WF, исполняющихся долгое время.

поддержка механизмов управления извне
поведением исполняющихся заданий и их
жизненным циклом;

поддержка коммуникации между узлами WF во
время исполнения.

возможность изменения WF во время
исполнения за счет сценария WF, а также за счет
внешнего управления.
11
Модель интерактивных КП
Инфокоммуникационные технологии в научных исследованиях
Интеллектуальная поддержка


Интеллектуальные технологии – технологии, построенные на знаниях
Интеллектуальные технологии предполагают наличие



Базы знаний
Механизма логического вывода (рассуждений на знаниях)
Механизма адаптации (формализации, приобретения и оценки новых
знаний)
В нашем случае: знания – закономерности использования
предметно-ориентированных программных компонентов
Базовый способ хранения знаний: онтологическая структура
1)
Иерархия уровней абстракции: метаописание  абстрактное описание 
предметная реализация  системная реализация
2)
Вложенная структура онтологий: каркасное описание классов 
описание реализации  пользовательское расширение
3)
Динамическая расширяемость а) на основе правил; б) на основе
подключаемых компонентов
14
Инфокоммуникационные технологии в научных исследованиях
Онтология – инструмент интеграции
Описание
Описание
инфраструктуры
реализации
Преобразование
данных
Оценка данных
Коллективная
работа
Предметная
область
Информационная
поддержка
Сессия
пользователя
15
Диалог
с
Правила
обработки
пользователем
сессии
Инфокоммуникационные технологии в научных исследованиях
Поиск и ранжирование решений
Задача поиска
седловой точки
Задача
Задача одной
точки
Задача оптимизации геометрии
Задача одной точки
Входные параметры:
► Cистема: файл
Выходные параметры:
◄ HF (KS) орбитали
◄ HF (KS) энергия
Метод
Объяснение вывода
Хартри-Фока
+ CC
Хартри-Фока
Хартри-Фока
Хартри-Фока
Входные параметры:
► Базис: 6-31G
Входные параметры:
► Базис: MINI
Входные параметры:
► Базис: PC3
ORCA
Пакет
Характеристики системы
Количество атомов: 23
Состав атомов: H: 10; O: 6; C: 7
Хартри-Фока
+ MP2
Хартри-Фока
DFT
GAMESS
MOLPRO
ORCA
GAMESS
Сервис
Кластер
НИИ НКТ #1
Входные параметры:
► Тип SCF: RHF
► Максимальное число
итераций SCF: 300
► Прямое SCF: Да
Грид ННС
Время расчета: 20...32 мин
Стоимость: 10 ед.
►
Надежность: 0,98
ЗАПУСК
Точность: 0,6
Редактирование скрипта
16
GAMESS
GAMESS
Входные параметры:
► Тип SCF: RHF
► Максимальное число
итераций SCF: 300
► Прямое SCF: Да
Кластер
НИИ НКТ #1
Онтологическое
концептуальной
иерархии
компьютерного
моделирования
 Оценка качества
допустимых
решений
(точность,
скорость,
надежность)
 Реализация в
виде
интерактивного
дерева решений

Информация о параметрах
Грид ННС
Время расчета: 1...1,5 ч
Стоимость: 30 ед.
Надежность: 0,95
Точность: 0,95
►
ЗАПУСК
Редактирование скрипта
Объяснение вывода
Объяснение вывода
Дополнительная информация
Дополнительная информация
Инфокоммуникационные технологии в научных исследованиях
Концепция виртуальных
моделирующих объектов
Виртуальный объект – структурированная композиция моделей, для
исследования некоторого объекта реального мира, снабженная графическим
интерфейсом для пользовательской настройки процесса моделирования
Baltic sea : Sea
Mode:
forecast
...
Bases
Наборы данных
-могут быть получены из
внутренних или внешних
для объекта источников
- выбор источника:
хранилище, внешний
сервис, явное задание
- проверяется на
корректность и
доступность
Модели
- преобразуются в части
композитного
приложения;
- могут быть настроены:
выбор ПО и сценария,
задание параметров;
- могут быть включены
или исключены из
состава используемых
Space
FG: Full grid
Time
ST: Start time
AP: Assimilation points
FT: Forecast time
Ø
Ø
Базы объекта
определяет доступные
базы параметров
(пространство, время,
группа)
Object parameters
FG/Ø
Bathymetry
?
Source storage
...
FG/FT
ОК
Aloft wind
Source BOOS
Scenario:
From aloft wind
Software:
NWW_ITMO
...
Workflow...
Sea waves
Parameters...
Статус набора данных
- проверен (ОК)
- требует настройки (?)
- недоступен (Х)
FG/FT
Scenario:
Shallow water
Software:
Swan
Near-water wind
Source storage
ОК
...
FG/FT
Parameters...
Wave spectrum
Source model
17
Параметры объекта
доступны всем
моделям объекта
Near-water wind
Workflow...
Режим работы объекта
- прогноз
- статический анализ
- оптимизация параметров
ОК
Базы набора данных
Выбираются из баз
объекта
...
Инфокоммуникационные технологии в научных исследованиях
Композиция виртуальных объектов
Baltic sea : Sea
Mode:
forecast
...
Bases
Space
FG: Full grid
Time
ST: Start time
AP: Assimilation points
FT: Forecast time
Ship #1 : Ship
Ø
Space
Object parameters
FP: Force points
Time
ST: Start time
?
Source storage
FG/FT
ОК
Source BOOS
Scenario:
From aloft wind
Software:
NWW_ITMO
AP/ST
storage
Source
Parameters...
ОК
Near-water wind
Source storage
...
Level and currents
...
storage
ОК
...
model
Forces application
Source
...
ОК
storage
...
Ship behavior
Wave selection
FG/FT
Ø/MT
Scenario:
Ship behavior
Software:
ShipX
Workflow...
Scenario:
With assimilation
Scenario:
Shallow water
Software:
BSM+Assimilation
Software:
Swan
Workflow...
Source
...
Parameters...
Sea waves
Parameters...
ОК
Ship model
FP/MT
FG/FT
ОК
ОК
Ø/MT
Wave spectrum
...
Workflow...
Workflow...
Ø
Ø/Ø
Source
Near-water wind
Источник storage
Ø
MT: Simulation time
Ø/Ø
Initial position
Level (obs.)
...
Object parameters
...
Aloft wind
analysis
Bases
Ø
FG/Ø
Bathymetry
Mode:
Parameters...
Ø/MT
Ø/MT
Movement
Parameters...
Source model
ОК
Resonance
Source model
...
ОК
...
Ø/MT
FG/FT
FG/FT
Water level
Source
model
ОК
Source model
...
Rocking spectrum
ОК
Wave spectrum
Source model
...
ОК
...
Ø/Ø
FG/FT
Spectrum parameterization
ОК
Currents
Source model
Recommendations
Source
Scenario:
...
model
ОК
...
Jonswap
Ø/MT
Software:
FG/FT
Wave parameters
Spectrum_interp
X
Workflow...
Source
18
model
Parameters...
Analysis log
Source
model
ОК
...
Recommendations
Scenario:
Situation analysis
Software:
ShipDSS
Workflow...
Parameters...
...
Инфокоммуникационные технологии в научных исследованиях
Классы интерфейсов пользователя
Интерфейс консольного / программного
доступа – решение для интеграции



Проблемно-ориентированный
интерфейс – решение типовых задач с
поддержкой ввода параметров
Система управления workflow – решение
исследовательских задач с и построение
композитных приложений
 Интеллектуальный инструктор – поддержка
сравнения и выбора типовых решений

Виртуальные моделирующие объекты –
системный подход к композиции приложений
19
Инфокоммуникационные технологии в научных исследованиях
Системы виртуальной реальности
20
Инфокоммуникационные технологии в научных исследованиях
Применение платформы CLAVIRE (1/4)
Облачный УНК «Компьютерное моделирование в нанотехнологиях»
http://hpc-nasis.ifmo.ru
21
Инфокоммуникационные технологии в научных исследованиях
Применение платформы CLAVIRE (2/4)
Система предотвращения наводнений в Санкт-Петербурге
Система поддержки
принятия решения –
технология экстренных
вычислений
- Ограничение на время
принятия решений
- Использование динамической
распределенной архитектуры
- Автоматизация управления
вычислительными ресурсами
- Сессионность и приоритеты
Средства компьютерного
моделирования
Актуальные прогнозы
Гидрометеорологические модели
Измерения уровня моря
Модели технических
объектов
Датчики КЗС
Социальные модели
Оперативная информация
Информационные
модели
Оценка рисков
(автоматическая/ручная)
Моделирование
сценариев
СППР
Вычислительная инфраструктура
Оператор
22
Группа,
принимающая
решения
Инфокоммуникационные технологии в научных исследованиях
Применение платформы CLAVIRE (3/4)
Задача моделирования флэшмоб-акций.
Исследования критических ситуаций, связанных с
террористическими действиями в условиях
несанкционированных флешмоб-акций,
организованных с использованием социальных сетей
Результат работы — статическое
определение зон с критическим
значением плотности агентов
Этапы работы приложения:
1.
2.
3.
4.
5.
Генерация комплексной
сети;
Удаление случайных узлов;
Моделирование
распространения
информации по
полученным сетям;
Агрегация и подсчет
статистических
характеристик;
Моделирование эвакуации
и визуализация в
интерактивном режиме;
23
Визуализация во время моделирования
Инфокоммуникационные технологии в научных исследованиях
Применение платформы CLAVIRE (4/4)
Сопряжение с системами виртуальной реальности
- Семантическая интеграция объектов трехмерной сцены и виртуальных
моделирующих объектов
- Использование интерактивных технологий для «погружения» в виртуальную
реальность
- Применение нейрокомпьютерных интерфейсов для оценки трехмерной сцены
0.2
1.0
0.7
24
Инфокоммуникационные технологии в научных исследованиях
Заключение
Разработанная платформа CLAVIRE обеспечивает
унифицированный доступ к разнородным ресурсам в рамках
облачной инфраструктуры, при этом обеспечивая:







25
Работу в рамках формализма workflow с использованием
предметно-ориентированных языков
Возможность создания интерактивных композитных
приложений
Динамическое планирование и управление выполнением
композитных приложений
Высокоуровневую поддержку с использованием семантических
технологий
Возможности создания и распространения проблемноориентированных коллекций сервисов
Доступ с использованием пользовательских интерфейсов
различных классов (уровней)
Расширенную поддержку систем виртуальной реальности с
использованием современных технических решений
Инфокоммуникационные технологии в научных исследованиях
Скачать