PRIMEQUEST - высокая надежность сегодня

advertisement
PRIMEQUEST высокая
надежность
сегодня
Надежность уровня мейнфрейма
для критически важных
вычислений
Платформы Fujitsu корпоративного уровня
Размер системы
Мейнфремы
UNIX Серверы
Linux/Windows
Серверы
Систмеы хранения
Мировой лидер в рейтинге ТОР 500
Суперкомпьютеры
Global Server
PRIMEFORCE
SPARC Enterprise
PRIMEQUEST
ETERNUS
High-end
DX8000
PRIMERGY
Системы
среднего
уровня
GS series BS series DX500/600
[Solaris]
DX100/200
Начальный
уровень
ESX, OVM, HyperV
[Linux/Windows]
Copyright 2012 FUJITSU
JX40
1
Системы для критически важных приложений
Определение
A
Системы, выход из строя которых в часы работы предприятия приведет к
прекращению бизнес-операций
Read more: http://www.businessdictionary.com/definition/mission-critical.html#ixzz1r3wQQO4B
Определение
B
Системы, которые являются неотъемлимой частью для нормального
функциониования компании. Если критически важная система выходит из
строя, то вся компания может «пойти ко дну»
Read more: http://bottomlineit.wordpress.com/2011/08/18/the-changing-definition-of-mission-critical/
Определение
Fujitsu
Системы с супервысоким уровнем надежности, чтобы обеспечить
непрерывность бизнес-процессов заказчика. Вычислительные системы,
которые изначально проектируются, разрабатываются и производятся с
учетом этих требований – высочайший уровень качества, позволяющий
избегать сбоев в работе оборудования
Пример – система FUJITSU FACOM 128B. Год производства – 1959.
Находится в полностью исправном и работоспособном состоянии.
2
FUJITSU – синоним для “Mission Critical”
 Самый старый в мире компьютер, который до сих пор
работает FACOM 128B, выпущен в1959
 1974: первый мейнфрейм – система FACOM M-190
 1976: Поставка мейнфрейма AMDAHL 470V/6 в NASA
 2002: Выпуск GS21 600, самого быстрого в мире
мейнфрейма
 2004: PRIMEPOWER- первый в мире UNIX-сервер,
основанный на 90-нм технологии
 2005: PRIMEQUEST, - самый мощный IA-64 сервер для
критически важных вычислений
 2007: Выпуск Solaris/SPARC Enterprise servers SES
 2012: PRIMEQUEST 1000 Series:
Сервер для критически важных приложений на x86
Copyright 2013 FUJITSU LIMITED
3
Copyright 2014 FUJITSU LIMITED
Серверы для критически важных вычислений
 За многие годы успешной работы слова Mission Critical и FUJITSU во всем мире
стали синонимами
 До недавненго времени только мейнфреймы и UNIX-системы могли
рассматриваться как платформа для критически важных вычислений
 У Fujitsu сегодня есть ряд уникальнейших технологий, которые долгие годы
применялись только в мейнфреймах и суперкомпьютерах
 Однако, мир критически важных серверов
сильно изменлся за прошедшие
несколько лет
4
Copyright 2014 FUJITSU LIMITED
Тектонический сдвиг платформ для критически
важных вычислений
PRIMEQUEST открывает мир критически важных вычислений на x86 уже
сегодня
5
Copyright 2014 FUJITSU LIMITED
Позиционирование PRIMEQUEST и UNIX
 PRIMEQUEST – наименьшая цена среди серверов класса
Enterprise при таком же уровне надежности
 Уровень надежности «обычного х86 сервера» и
надежность PRIMEQUEST – совершенно разные вещи
Product-Market Mapping
Cost-efficiency
General
PC
PQ single server
server
IBM Power System/HP
Superdome-2
Reliability
6
Copyright 2014 FUJITSU LIMITED
Процесс Контроля Качества
 Доскональное тестирование 20 серверов от 3 до 6 месяцев

Тестирование функций RAS, администрирования, технического
обслуживания, инсталляционных процедур, настроек и нормального
функционирования
 Тестирование допустимых отклонений

Подтверждение допустимых отклонений в расширенном диапазоне
уровней напряжения, температуры и тактовых частот
 Полное тестирование системы

Тестирование с полной загрузкой при работающих приложениях

Всестороннее тестирование механизмов RAS
Путем искуственного привнесения помех и ошибок
Привнесение даже незначительных изменений в заводскую компоновку
системы (например, изменение крепежных винтов), требует проведение
повторной процедуры тестирования и получение одобрения от Отдела
Контроля Качества
7
Copyright 2014 FUJITSU LIMITED
Токийская фондовая биржа
PRIMEQUEST работает на одной из
крупнейших фондовых бирж мира
 В эксплуатации с 4 Января 2010
 PRIMEQUEST и Linux
Особенности проекта
Миграция с мейнфреймов Fujitsu
Высочайшая производительность
• Время отклика менее 2 мс
• Больше чем в 1000 раз быстрее предыдущей системы
Высочайшая надежность
• Надежность уровня мейнфреймов
Линейная масштабируемость, возможность апгрейда
без остановки приложений
• Возможность on-line удвоить производительность при пиковых нагрузках
8
Copyright 2013 FUJITSU LIMITED
Отвечая самым жестким требованиям
PRIMEQUEST – уникальная платформа
Высокая надежность
→ Устранение простоев благодаря динамическому
реконфигурированию (Динамическое добавление
CPU, памяти, и/или IO), резервная System Board,
избыточность компонентов
Изоляция ресурсов
→ Физические (Аппаратные) разделы
Высочайшая пропускная способность /
Расширяемость
→ Max. 8CPU (120 Cores)
→ Max.12TB Memory (192 DIMMs)
→ Max. 56 PCIe slots
FUJITSU Server
PRIMEQUEST 2000
Новейшие технологии для систем реального времени и малого
времени отклика
→ PCIe SSD, Infiniband, 10GbE, PCIe Gen3
9
Новое поколение PRIMEQUEST
PRIMEQUEST 1000 Series
New PRIMEQUEST 2000 Series
PRIMEQUEST
2800E (8skt)
PRIMEQUEST
1800E2 (8skt)
PRIMEQUEST
2400E (4skt)
PRIMERGY RX Series
RX900S2
(8skt)
PRIMEQUEST
2800B (8skt)
Семейство PRIMEQUEST теперь состоит из трех моделей
10
Fujitsu PRIMEQUEST 2400E и 2800E
Надежность уровня мейнфрейма для Linux и Windows
Особенности
 Эффективность
 Эффективность и гибкость архитектуры x86 при
надежности уровня мейнфрейма
 Экономическая эффективность
 Низкий уровень энергопотребления
 RAS функции
 Аппаратные и расширенные разделы (партиции)
 Системная плата горячего резерва
 Гибкость подсистемы ввода/вывода
 Практически все компоненты продублированы
 Динамическая платформа для современного ЦОДа
 8x Intel Xeon процессоров E7-8800 v2
 До 12TB памяти и 120 ядер
 Новый уровень надежности и динамичности –
возможность реконфигурирования аппаратной части
системы без перезагрузки
11
Сценарии использования
Критически
важные
приложения
Аналитика в
реальном
времени
Масштабируемые
базы данных
Консолидация
серверных
мощностей
Copyright 2014 FUJITSU
PRIMEQUEST 2800E
Ресурсы для аппаратных разделов
PRIMEQUEST 2800E
•
До четырех системных плат, каждая укомплектована
• 2x CPU Intel Xeon E7v2,
• 3TB memory max,
• 4 HDD slots
• Один или два отдельных
• дисковых модуля, каждый до
4x HDD / SSD .
•
1-4x IO-Unit -F /-L, 12-16PCIe слотов максимум без учета
внешних IO Box
Опционально до 4 внешних IO-box
IO-Box#0 to IO-Box#3
2x 6x PCIe G3 PCIe слотов
12
Copyright 2014 FUJITSU
PRIMEQUEST 2x00B/E
Сценарий использования для SAP HANA
 PRIMEQUEST –лучший выбор для SAP HANA
Высокоскоростные in-memory базы данных, системы реального времени и аналитики.
•
Производительность увеличивается в десятки и сотни раз.
Easy Scale-up

Возможность масштабирования от S до XXL

Продуктив, разработка и аналитика на одном сервере
 Высокая надежность – использование системной
платы горячей замены

Динамическое реконфигуриование под управлением
Scale-up

Size XL
8 socket
6TB
RedHat6.5 / SuSE12
Обнаружена
аппаратная
ошибка
1
2
spared
Application
Application
Динамическое
добавление
резервной SB в
раздел
CPU
Mirror
Зеркалирование памяти
защищает приложение от сбоя
CPU
3
Нормальный режим
Application
Size S
2 socket
256 GB
Mirror
Memory
Memory
ERR
ERR
• PRIMEQUEST 2800E
T-shirt S to XXL certification
removed
INTERNAL USE ONLY
Изъятие
дефектного
модуля
Enable Upgrade
in One Box
Динамическое
удаление сломанного
модуля из раздела
Application
4
Size XXL
8 socket
12TB !
ERR
13
Copyright 2014 FUJITSU
Аппаратные разделы
 Каждый сервер может быть динамически разделен на
несколько независимых аппаратных систем
• Различные ОС в различных аппаратных разделах.
• Перезагрузка и останов отдельного
• раздела
Partition A
• Возможность гибкого подключения
плат IO и системных плат
• Системные платы горячего резерва
• Максимальное время безостановочной
работы благодаря автоматическому переходу приложений на резервные системные
платы
• Работа нескольких независимых приложений без влияния на производительность
друг друга
• Использование программных средств
виртуализации «поверх» партиций
(Vmware, Hyper-V)
14
Partition B
Partition C
Copyright 2014 FUJITSU LIMITED
Поддерживаемые типы разделов
Физические разделы
(PPAR)
Расширенные разделы
(extended Partition)
Программные разделы
(Гипервизор)
Уровень
изоляции
Hardware
Hardware/Firmware
Hypervisor
Ключевые
отличия
Высокая надежность и
производительность
Хороший уровень
консолидации и надежности
Высокая степень
консолидации
Application
errors don’t
other
partitions
УровеньApplication
приложений:level:
Ошибки
работы приложения
неaffect
влияют
на другие
разделы
Fault tolerance
Firmware
level:
F/WF/W
errors
do not affectдругие
others
Уровень
микрокода:
ошибки
не затрагивают
разделы
Аппаратный уровень:
уровень ошибки H/W не затрагивают другие разделы
Гибкость и
гранулярность
Блок-схема
Элемент системы –
системная плата, IOU
Большинство ошибок H/W
изолируются внутри разделов
Гранулярность до слота PCI , В процентах от аппаратных
ядра CPU , DIMM, и.т.д.
ресурсов: 10% от ядра CPU,
и.т.д.
App
App
App
App
OS
Firmware
Hardware
OS
Firmware
Hardware
OS
Firmware
Hard
OS
Firmware
ware
15
App
App
OS
OS
Hypervisor
Hardware
Copyright 2014 FUJITSU
Снижение стоимости использования Oracle DB
 Сравнение с UNIX-серверами c 4~8 сокетами
 При одинаковой производительности
Oracle License & Support Charge
Comparison under similar performance
Number of
Oracle license
&
Support charge
70
64
60
48
50
40
32
30
24
20
10
0
New PQ with 8 socket
(3.4GHz/6core)
HP Superdome2
8sockets
IBM Power 760
IBM Power 750
Copyright 2014 FUJITSU LIMITED
16
История успеха: Meditel, Morocco
»крайне редкая ситуация – проект
такого масштаба и уровня
сложностиt был выполнен без
каких-либо серьезных трудностей
и осложнений «
Manuel Garcia, CTO Méditel
Конфигурация
ПРЕИМУЩЕСТВА
•17x PRIMEQUEST 1800E
•40x PRIMERGY BX900 server blades on RED Hat Enterprise Linux 5.4 and Oracle
Databases
•2xETERNUS DX 8700 S2
•ETERNUS CS 2000
•ETERNUS DX90

Максимальная непрерывность бизнеса

Катастрофоустойчивая избыточная конфигурация высочайшего уровня надежности –
аппаратные разделы, разнесенное резервное копирвание, полностью избыточная
конфигурация

Использование открытых стандартов: Intel Xeon,
Red Hat Enterprise Linux для критически
17
важных конфигураций существенно снижает показатель цена/производительность

Стоимость сервисного обслуживания в год для новой системы составила менее 1/3 от
предыдущей, куда более медленной системы.
17
Copyright 2014 FUJITSU
18
Copyright 2013 FUJITSU LIMITED
Download