Что такое GRID и зачем он нужен современным физикам?

advertisement
Мицын Сергей,
инженер-программист Лаборатории
Информационных Технологий
ОИЯИ 2012
Открытие в 1930-х
• ~2 учёных из одной страны
• ручка и бумага
Открытие в 1970-х
• ~200 учёных из ~10 стран
• Мэйнфреймы
Открытие завтра
• ~2000 учёных из ~100 стран
• Гриды
Научная школа
3
Мейнрейм
Пользовательские
терминалы
Передача данных
(оптоволокно)
Увеличение в 2
раза за
месяцев
Производительность
процессоров
Годы
Объём
хранилищ
данных
Вычислительный
кластер
Персональные
компьютеры
1992 – 64 Кбит/с спутниковый канал
связи с узлом сети HEPNET в Италии
1994 – 64 Кбит/с спутниковый канал
связи с узлом сети DFN в Германии
1995 – 128 Кбит/с наземный канал
связи с узлом INTERNET в Москве
1997 – 2 Мбит/с оптический канал
связи ОИЯИ-ЦКС «Дубна»Шаболовка-М9. Узел сети RBNet в
Дубне
2001 – реализация проекта ATM канала
связи Дубна-Москва емкостью 622
Мбит/с (155 Мбит/с для ОИЯИ)
2005 – реализация проекта канала
связи Дубна-Москва на основе
технологии SDH емкостью 2.48
Гбит/с (1 Гбит/с для ОИЯИ)
2007- 2008 – проработка проекта
канала связи Москва-Дубна на базе
технологии DWDM - от 10 Гбит/с
Мбит/сек
10000
1000
100
10
1
0.1
0.01
1990
1995
2000
2005
2010
Научная школа
1.25 GB/sec
(ions)



Эксперименты будут производить 10-15
Петабайт данных ежегодно (20 миллионов
CD)
Для анализа данных требуется
компьютерная мощность, эквивалентная
100 000 современных самых мощных
процессоров
Моделирование событий
Вычислительные кластеры
различных учреждений:
университеты, частные
компании
Пользователи
Ресурсы хранения
данных

1 событие:
◦ ~8 минут на 12-типроцессорном Xeon X5650
2.67GHz…

…повторить 100000 раз…
◦ …2 месяца непрерывных вычислений?

Решение: кластер!
◦ Построение собственного или аренда чужого?
Научная школа
К Гриду
Certificate
Certificate
Application
database
Data
Authorised users
directory
Certificate
Grid job
management service
Cluster
Data
Policies
SSH
Certificate
Certificate
User
User
Information
services
Data
Certificate
Grid
tools
Certificate
Grid job
management service
Cluster
SSH
Certificate
Data
User
User
Grid
tools
14
Разделение ресурсов: Глобальное разделение ресурсов – суть грида.
Безопасный доступ: доверие между пользователями и провайдерами ресурсов –
необходимо, особенно когда они не знают друг друга. Разделение ресурсов
противоречит политикам безопасности.
Использование ресурсов: необходимо эффективное, сбалансированние
использование ресурсов.
Расстояния: расстояние не должно играть никакой роли: у любого должен быть
доступ к компьютерным ресурсам из любого места.
Открытые стандарты: необходимо взаимодействия между различными гридами,
достигаемое открытыми стандартами разработки, которые позволяют
каждому человеку участвовать в разработке. Стандартизация также позволит
индустрии инвестировать в коммерческие гриды.
1 ZFlops
100 EFlops
10 EFlops
1 EFlops
100 PFlops
10 PFlops
1 PFlops
100 TFlops
10 TFlops
1 TFlops
100 GFlops
10 GFlops
1 GFlops
100 MFlops
1993
Суммарная
производительность
top500
#1
1 Petaflops
Анализ
аэродинамики:
Примеры
реальных задач:
Petaflops
Лазерная
• Полное оптика:
моделирование самолёта в 10
любых
условиях
20
Petaflops
Молекулярная динамика в биологиии
• «Зелёные» самолёты
1 Exaflops
Проектирование аэродинамики:
•Вычислительная
Медицина, основанная
на
генетике
10 Exaflops
космология:
•Физическая
Изучение возникновения
вселенной
100 Exaflops
турбулентность:
• Синтетическое горючее
1 Zettaflops
Вычислительная
химия:
• Точное предсказание погоды
1999
2005
2011
2017
2023
2029
~2018
2008
~1997
~1987
«Проход каждого этапа знаменовался важными
прорывами в науке и технике»
Источник: IDC “In Pursuit of Petascale Computing: Initiatives Around the World,” 2007









Физика высоких энергий (БАК, CERN);
Биомедицина - HealthGrid (GEMSS, MammoGrid, Pharma Grid, BioGrid,
Infogenmed);
Молекулярная биологии для моделирования структуры белка, анализа
последовательностей ДНК;
Бизнес — нефтяная отрасль, геологоразведка;
В банковском деле;
В автомобильной промышленности Grid позволяет ускорить и удешевить
расчет виртуальных крештестов;
Airbus и Boeing используют технологию для постоянного контроля состояния
двигателей и других агрегатов и узлов самолета показания датчиков,
непрерывно собирающих информацию, через спутник передаются на землю,
где анализируются в сетях Grid;
IBM активно использует технологию Grid для внутренних нужд (моделирование
при создании микропроцессоров следующих поколений, таких, как Power5 и
Power6”).
Радиоастрономия
The Worldwide LHC Computing Grid (WLCG)
350 сайтов
55 стран
150,000 CPUs
60 Петабайт
(дисковые
хранилища)
>15,000
пользователей
>300 организаций
1 млн. задач/день
Астрономия и
астрофизика
Безопасность населения
Вычислительная химия
Вычислительные
науки/Программирование
Физика
конденсированного
состояния
Науки о Земле
Синтез
Физика высоких энергий
Науки о жизни
20
Статистика использования процессорного времени по
странам (январь 2010 - апрель 2011)
21
21
Развитие грид-окружения в ОИЯИ


2064 ядра:
◦ 60x 2 проц., 2 яд. Xeon 5150
2.66Ghz
◦ 30x 2 проц., 4 яд. Xeon E5430
2.66Ghz
◦ 10x 2 проц., 4 яд. Xeon X5450
3.00Ghz
◦ 10x 2 проц., 4 яд. Xeon X5410
2.33Ghz
◦ 54x 2 проц., 4 яд. Xeon E5420
2.5Ghz
◦ 60x 2 проц., 4 яд. Xeon E5430
2.66Ghz
◦ 40x 2 проц., 6 яд. Xeon X5650
2.66Ghz
◦ 4x 2 проц., 4 яд. Xeon X5540
2.536Ghz
Все компьютеры подключены к
1Gb ethernet, некоторые
соединены через Infiniband.
Научная школа
22
Научная школа
Интернет

SaaS: программное обеспечение как услуга:
◦ Предоставляет минимум возможностей для
модификации пользователем;
◦ Доступ – через web;
◦ От почты до баз данных.

IaaS: Инфраструктура как услуга:
◦ Предоставление вычислительных ресурсов и
ресурсов хранения через интернет.
◦ Низкоуровневая спецификация, поддержка
стандартных архитектур аппаратного
обеспечения (x86, OpenCL, …)
◦ Виртуализация ресурсов.

PaaS: платформа как услуга:
◦ Набор программного обеспечения и
инструментария разработчика на инфраструктуре
поставщика услуг; обычно - Python, Java, .NET
◦ Google app engine

Преимущества:
◦ Дешевизна - оплата за реально использованные
ресурсы;
◦ Гибкость – возможность получить столько
ресурсов, сколько нужно;
◦ Доступ через интернет с любого компьютера;

Недостатки – продолжение преимуществ:
◦ Безопасность;
◦ Доступность зависит от наличия интернета;
◦ В некоторых случаях цена может быть выше
собственных ресурсов.
Download