Файловые системы для вычислительных кластеров

advertisement
Файловые системы для
вычислительных кластеров
Краткий обзор
2
Файловые системы для HPC
Зачем нужны?
Чем различаются?
Какие самые известные?
Сколько стоят?
3
Распределенные файловые системы
Нет монополизации LUN конкретным сервером
•сохраняются возможности блокировки
отдельных файлов на чтение и запись
Высокая масштабируемость
•по данным и метаданным
Высокая надёжность
Относительная дешевизна
4
Особенности масштабируемых ФС
Производительность
? single-thread (GB/s)
? multi-thread (GB/s)
? обработка коротких
операций ввода-вывода
? метаданные
Совместимость
? операционные системы и
их версии
Масштабируемость
? по данным
? по метаданным
Надёжность
? kernel space / user space
? репликация данных
? снэпшоты
Функциональность
? снэпшоты
? пулы ресурсов и HSM
? дедупликация
Стабильность
? количество внедрений
? SLA службы поддержки
Стоимость
5
Самые известные масштабируемые ФС
IBM GPFS
Lustre File System
Hadoop Distributed File System (HDFS)
Fraunhofer File System (BeeGFS)
---Panasas File System (PanFS)
Quantum StorNext File System
6
IBM GPFS
7
IBM GPFS — архитектура
8
IBM GPFS — сильные и слабые стороны
Сильные стороны:
•высокая производительность
•мгновенные снимки, пулы ресурсов
Слабые стороны:
•сложность настройки
•множество недокументированных параметров
•отсутствие графической консоли управления
•дороговизна лицензий и техподдержки
•перегрузка служб техподдержки
9
GPFS --- клиенты в нефтегазовом секторе
Petrobras
Exxon Mobil
ENI
British Petroleum
Подробности недоступны!
10
IBM GPFS --- стоимость (List Price)
Сервер:
•лицензия + 1 год поддержки — 184 USD
•доп. 1 год поддержки — 36.75 USD
Клиент:
•лицензия + 1 год поддержки — 2.20 USD
•доп. 1 год поддержки — 0.45 USD
Все цены — за 10 PVU
•в типичном современном Intel Xeon
--- 70 PVU на 1 ядро
11
LUSTRE (IEEL)
12
Lustre --- архитектура
13
Lustre — сильные и слабые стороны
Сильные стороны:
•высочайшая производительность
•высочайшая масштабируемость
•графическая консоль управления
•бесплатность лицензий и дешевизна
коммерческой техподдержки
•возможность работы с любыми массивами
Слабые стороны:
•нет снимков, пулов хранения, дедупликации
•мало публичных историй успеха
в нефтегазовой отрасли
14
Масштабируемость Lustre — 1.5 ТБ/с
15
Внутри инсталляции LLNL --- NetApp E5400
16
Lustre + ZFS --- потеря производительности
17
Lustre --- клиенты в нефтегазовом секторе
DownUnder Geosolutions (Australia)
•Сluster size: 12’000 cores
•Storage size: 1.5 PB
•I/O performance: 10 GB/s
Total S. A. (France)
•Сluster size: 110’592 cores
•Storage size: 7 PB
•Pangea --- крупнейший коммерческий
суперкомпьютер в мире!
18
Lustre File System — история и команда
1999 --- Университет Карнеги-Мелон
2003 — Cluster File Systems, Inc.
2007 --- Sun Microsystems, Inc.
2010 --- Oracle Corporation
2010 --- Whamcloud
2012 --- Intel Corporation
Brent Gorda
Eric Barton
Peter Braam
Andreas Dilger
19
«СетьПроект» — партнёр Intel в России
20
Intel Lustre --- стоимость (List Price)
Сервер (OSS):
•1 год поддержки — 7000 USD
Клиент:
•бесплатно
21
APACHE HDFS
22
HDFS --- архитектура
23
HDFS — сильные и слабые стороны
Сильные стороны:
•широкая распространенность
•социальные сети, поисковые машины
•масса вариантов коммерческой поддержки
•возможность работы с любыми массивами
•бесплатность лицензий и дешевизна
коммерческой техподдержки
Слабые стороны:
•плохая производительность по операциям
записи
•плохая масштабируемость
•множество несовместимых версий
•нет историй успеха в нефтегазовой отрасли
24
HDFS --- крупнейшие внедрения
25
FRAUNHOFER GFS (BEEGFS)
26
BeeGFS --- архитектура
27
BeeGFS --- сильные и слабые стороны
Сильные стороны:
•универсальность (полностью в user space)
•распределенные серверы метаданных
•высочайшая производительность
•особенно single-thread
•графическая консоль управления
•бесплатность лицензий и дешевизна
коммерческой техподдержки
•возможность работы с любыми массивами
Слабые стороны:
•нет снимков, пулов хранения, дедупликации
•мало публичных историй успеха
в нефтегазовой отрасли
28
BeeGFS--- клиенты в нефтегазовом секторе
Det norske oljeselskap (Норвегия)
RockSolidImages (США)
Lundin (Норвегия)
Подробности недоступны!
29
BeeGFS --- типичная инсталляция
30
BeeGFS --- производит-сть Single-Thread
Оборудование:
•5 storage servers по 36 дисков RAID60
Тест:
•iozone 1-thread, 1-node
Результаты BeeGFS:
•2’484’441.50 Kbytes/sec, Sequential Write
•1’087’680.75 Kbytes/sec, Sequential Read
Результаты Lustre (для сравнения):
•465’339.94 Kbytes/sec, Sequential Write
•378’283.56 Kbytes/sec, Sequential Read
31
BeeGFS --- производит-сть Multi-Thread
Оборудование:
•5 storage servers по 36 дисков RAID60
Тест:
•IOB_5 (8 threads on 8 nodes)
Результаты BeeGFS:
•5’623’611.31 Kbytes/sec, Sequential Write
•7’913’005.2 Kbytes/sec, Sequential Read
Результаты Lustre (для сравнения):
•3’494’379.44 Kbytes/sec, Sequential Write
•2’750’521.81 Kbytes/sec, Sequential Read
32
BeeGFS --- стоимость (List Price)
Сервер (multi-target):
•1 год поддержки — 1600 EUR
Сервер (single-target):
•1 год поддержки — 1100 EUR
Клиент:
•бесплатно
33
Услуги «СетьПроекта»
Помощь в постановке задачи
•уточнение
исходных данных
•выявление
неочевидных ограничений
•организация
тестовых стендов
Внедрение СХД
•проектирование
•поставка
•развертывание
Сопровождение СХД
34
Знаем и умеем --- проверено!
Интернет:
Электр. почта:
Телефон:
Факс:
Адрес:
http://www.netproject.ru
info@netproject.ru
(495) 969-24-30
(499) 969-80-63
119334, Москва, 5-й Донской
проезд, 15 стр. 8
35
Дешевизна масштабируемых ФС
Задача --- файловая система для вычислительного
кластера:
•200 ТБ полезной емкости
•6 ГБ/с скорость последовательной записи
Расчет в ценах List Price
NetApp FAS (IO size = 32К):
•FAS8060
•8 узлов, 576 дисков 900 ГБ SAS 10K --- $4.4М
NetApp E-Series + Lustre (IO size = 256K):
•E2700
•6 узлов, 247 дисков 2 ТБ SATA --- $350K
Download