Мицын Сергей, инженер-программист Лаборатории Информационных Технологий ОИЯИ 2012 Открытие в 1930-х • ~2 учёных из одной страны • ручка и бумага Открытие в 1970-х • ~200 учёных из ~10 стран • Мэйнфреймы Открытие завтра • ~2000 учёных из ~100 стран • Гриды Научная школа 3 Мейнрейм Пользовательские терминалы Передача данных (оптоволокно) Увеличение в 2 раза за месяцев Производительность процессоров Годы Объём хранилищ данных Вычислительный кластер Персональные компьютеры 1992 – 64 Кбит/с спутниковый канал связи с узлом сети HEPNET в Италии 1994 – 64 Кбит/с спутниковый канал связи с узлом сети DFN в Германии 1995 – 128 Кбит/с наземный канал связи с узлом INTERNET в Москве 1997 – 2 Мбит/с оптический канал связи ОИЯИ-ЦКС «Дубна»Шаболовка-М9. Узел сети RBNet в Дубне 2001 – реализация проекта ATM канала связи Дубна-Москва емкостью 622 Мбит/с (155 Мбит/с для ОИЯИ) 2005 – реализация проекта канала связи Дубна-Москва на основе технологии SDH емкостью 2.48 Гбит/с (1 Гбит/с для ОИЯИ) 2007- 2008 – проработка проекта канала связи Москва-Дубна на базе технологии DWDM - от 10 Гбит/с Мбит/сек 10000 1000 100 10 1 0.1 0.01 1990 1995 2000 2005 2010 Научная школа 1.25 GB/sec (ions) Эксперименты будут производить 10-15 Петабайт данных ежегодно (20 миллионов CD) Для анализа данных требуется компьютерная мощность, эквивалентная 100 000 современных самых мощных процессоров Моделирование событий Вычислительные кластеры различных учреждений: университеты, частные компании Пользователи Ресурсы хранения данных 1 событие: ◦ ~8 минут на 12-типроцессорном Xeon X5650 2.67GHz… …повторить 100000 раз… ◦ …2 месяца непрерывных вычислений? Решение: кластер! ◦ Построение собственного или аренда чужого? Научная школа К Гриду Certificate Certificate Application database Data Authorised users directory Certificate Grid job management service Cluster Data Policies SSH Certificate Certificate User User Information services Data Certificate Grid tools Certificate Grid job management service Cluster SSH Certificate Data User User Grid tools 14 Разделение ресурсов: Глобальное разделение ресурсов – суть грида. Безопасный доступ: доверие между пользователями и провайдерами ресурсов – необходимо, особенно когда они не знают друг друга. Разделение ресурсов противоречит политикам безопасности. Использование ресурсов: необходимо эффективное, сбалансированние использование ресурсов. Расстояния: расстояние не должно играть никакой роли: у любого должен быть доступ к компьютерным ресурсам из любого места. Открытые стандарты: необходимо взаимодействия между различными гридами, достигаемое открытыми стандартами разработки, которые позволяют каждому человеку участвовать в разработке. Стандартизация также позволит индустрии инвестировать в коммерческие гриды. 1 ZFlops 100 EFlops 10 EFlops 1 EFlops 100 PFlops 10 PFlops 1 PFlops 100 TFlops 10 TFlops 1 TFlops 100 GFlops 10 GFlops 1 GFlops 100 MFlops 1993 Суммарная производительность top500 #1 1 Petaflops Анализ аэродинамики: Примеры реальных задач: Petaflops Лазерная • Полное оптика: моделирование самолёта в 10 любых условиях 20 Petaflops Молекулярная динамика в биологиии • «Зелёные» самолёты 1 Exaflops Проектирование аэродинамики: •Вычислительная Медицина, основанная на генетике 10 Exaflops космология: •Физическая Изучение возникновения вселенной 100 Exaflops турбулентность: • Синтетическое горючее 1 Zettaflops Вычислительная химия: • Точное предсказание погоды 1999 2005 2011 2017 2023 2029 ~2018 2008 ~1997 ~1987 «Проход каждого этапа знаменовался важными прорывами в науке и технике» Источник: IDC “In Pursuit of Petascale Computing: Initiatives Around the World,” 2007 Физика высоких энергий (БАК, CERN); Биомедицина - HealthGrid (GEMSS, MammoGrid, Pharma Grid, BioGrid, Infogenmed); Молекулярная биологии для моделирования структуры белка, анализа последовательностей ДНК; Бизнес — нефтяная отрасль, геологоразведка; В банковском деле; В автомобильной промышленности Grid позволяет ускорить и удешевить расчет виртуальных крештестов; Airbus и Boeing используют технологию для постоянного контроля состояния двигателей и других агрегатов и узлов самолета показания датчиков, непрерывно собирающих информацию, через спутник передаются на землю, где анализируются в сетях Grid; IBM активно использует технологию Grid для внутренних нужд (моделирование при создании микропроцессоров следующих поколений, таких, как Power5 и Power6”). Радиоастрономия The Worldwide LHC Computing Grid (WLCG) 350 сайтов 55 стран 150,000 CPUs 60 Петабайт (дисковые хранилища) >15,000 пользователей >300 организаций 1 млн. задач/день Астрономия и астрофизика Безопасность населения Вычислительная химия Вычислительные науки/Программирование Физика конденсированного состояния Науки о Земле Синтез Физика высоких энергий Науки о жизни 20 Статистика использования процессорного времени по странам (январь 2010 - апрель 2011) 21 21 Развитие грид-окружения в ОИЯИ 2064 ядра: ◦ 60x 2 проц., 2 яд. Xeon 5150 2.66Ghz ◦ 30x 2 проц., 4 яд. Xeon E5430 2.66Ghz ◦ 10x 2 проц., 4 яд. Xeon X5450 3.00Ghz ◦ 10x 2 проц., 4 яд. Xeon X5410 2.33Ghz ◦ 54x 2 проц., 4 яд. Xeon E5420 2.5Ghz ◦ 60x 2 проц., 4 яд. Xeon E5430 2.66Ghz ◦ 40x 2 проц., 6 яд. Xeon X5650 2.66Ghz ◦ 4x 2 проц., 4 яд. Xeon X5540 2.536Ghz Все компьютеры подключены к 1Gb ethernet, некоторые соединены через Infiniband. Научная школа 22 Научная школа Интернет SaaS: программное обеспечение как услуга: ◦ Предоставляет минимум возможностей для модификации пользователем; ◦ Доступ – через web; ◦ От почты до баз данных. IaaS: Инфраструктура как услуга: ◦ Предоставление вычислительных ресурсов и ресурсов хранения через интернет. ◦ Низкоуровневая спецификация, поддержка стандартных архитектур аппаратного обеспечения (x86, OpenCL, …) ◦ Виртуализация ресурсов. PaaS: платформа как услуга: ◦ Набор программного обеспечения и инструментария разработчика на инфраструктуре поставщика услуг; обычно - Python, Java, .NET ◦ Google app engine Преимущества: ◦ Дешевизна - оплата за реально использованные ресурсы; ◦ Гибкость – возможность получить столько ресурсов, сколько нужно; ◦ Доступ через интернет с любого компьютера; Недостатки – продолжение преимуществ: ◦ Безопасность; ◦ Доступность зависит от наличия интернета; ◦ В некоторых случаях цена может быть выше собственных ресурсов.