Евгений Потапов ITSumma.ru, генеральный директор

реклама
Организация резервного
копирования сложных
интернет магазинов
Евгений Потапов
ITSumma
Евгений Потапов
ITSumma.ru,
генеральный директор
Круглоcуточное удаленное
администрирование
серверов и техническая
поддержка сайтов
100 миллионов
уникальных посетителей в
сутки на поддерживаемых
сайтах
на поддержке
Работаем с 2008 года
Офисы в Иркутске, СанктПетербурге и Москве
150+ клиентов на
круглосуточной поддержке
90ТБ резервных копий
5 оповещений о
«сломавшихся» бэкапов в
сутки
Содержание
• Что такое надежный бэкап?
• С какими проблемами можно столкнуться?
• Как правильно делать бэкапы?
• Как правильно проверять бэкапы?
• Disclaimer: говорим LA(N)MP
Критерии надежности бэкапа
• Бэкап создается, туда входит все необходимое
• Из бэкапа можно восстановиться в приемлемое время
• При восстановлении из бэкапа данные сохраняют свою
актуальность
• Из бэкапа можно восстановиться в случае аварии
сервера/датацентра
«Да чему там ломаться?»
Где можно ошибиться - БД
• Процесс дампа базы не запускается
Где можно ошибиться - БД
• Процесс дампа базы не запускается
• Дамп базы данных копирует не ту базу данных
Где можно ошибиться - БД
• Процесс дампа базы не запускается
• Дамп базы данных копирует не ту базу данных
• Во время резервного копирования заканчивается место на диске
Где можно ошибиться - БД
• Процесс дампа базы не запускается
• Дамп базы данных копирует не ту базу данных
• Во время резервного копирования заканчивается место на диске
• Дамп базы данных делается с неработающего слейва
Где можно ошибиться - БД
• Процесс дампа базы не запускается
• Дамп базы данных копирует не ту базу данных
• Во время резервного копирования заканчивается место на диске
• Дамп базы данных делается с неработающего резерва
• Дамп базы данных делается реже чем необходимо
Где можно ошибиться - БД
• Процесс дампа базы не запускается
• Дамп базы данных копирует не ту базу данных
• Во время резервного копирования заканчивается место на диске
• Дамп базы данных делается с неработающего резерва
• Дамп базы данных делается реже чем необходимо
• Дамп базы данных сохраняется только на том же сервере
Где можно ошибиться - БД
• Процесс дампа базы не запускается
• Дамп базы данных копирует не ту базу данных
• Во время резервного копирования заканчивается место на диске
• Дамп базы данных делается с неработающего резерва
• Дамп базы данных делается реже чем необходимо
• Дамп базы данных сохраняется только на том же сервере
• Дамп базы данных делается «хитрым» способом и
невосстановим
Где можно ошибиться - статика
• Статические файлы вообще не копируются
Где можно ошибиться - статика
• Статические файлы вообще не копируются
• Статика копируется без карточек товара
Где можно ошибиться - статика
• Статические файлы вообще не копируются
• Статика копируется без карточек товара
• Статика запаковывается в архив
Где можно ошибиться - статика
• Статические файлы вообще не копируются
• Статика копируется без карточек товара
• Статика запаковывается в архив
• Все складывается на тот же сервер
Где можно ошибиться - конфигурация
• «Конфиги» не бэкапируются
Как сделать правильно?
• Осознание и постановка требований
• Правильное копирование
• Регулярная проверка работоспособности
• Проверка восстановления
Как сделать правильно? – постановка
требований
• Насколько актуальными будут данные при восстановлении на
заданный момент времени?
Как сделать правильно? – постановка
требований
• Насколько актуальными будут данные при восстановлении на
заданный момент времени?
• Как долго займет процесс восстановления базы? Статики?
Сервера целиком?
Как сделать правильно? – постановка
требований
• Насколько актуальными будут данные при восстановлении на
заданный момент времени?
• Как долго займет процесс восстановления базы? Статики?
Сервера целиком?
• Где хранятся бэкапы? Насколько эта площадка не связана с
основной?
Как сделать правильно? – бэкап MySQL
• Mysqldump – долгая, блокирующая процедура с долгим полным
восстановлением.
Как сделать правильно? – бэкап MySQL
• Mysqldump – долгая, блокирующая процедура с долгим полным
восстановлением.
• Применяем Xtrabackup для создания полных копий (отдельные
таблицы восстановить можно, но сложнее) http://www.itsumma.ru/blog/1/
Как сделать правильно? – бэкап MySQL
• Mysqldump – долгая, блокирующая процедура с долгим полным
восстановлением.
• Применяем Xtrabackup для создания полных копий (отдельные
таблицы восстановить можно, но сложнее) http://www.itsumma.ru/blog/1/
• Сервер с отложенной репликацией для защиты от человеческого
фактора (pt-slave-delay или CHANGE MASTER TO MASTER_DELAY)
Как сделать правильно? – бэкап MySQL
• Mysqldump – долгая, блокирующая процедура с долгим полным
восстановлением.
• Применяем Xtrabackup для создания полных копий (отдельные
таблицы восстановить можно, но сложнее) http://www.itsumma.ru/blog/1/
• Сервер с отложенной репликацией для защиты от человеческого
фактора (pt-slave-delay или CHANGE MASTER TO MASTER_DELAY)
• Репликация и резервирование binlog-ов (с помощью mysqlbinlog https://www.percona.com/blog/2012/01/18/backing-up-binary-logfiles-with-mysqlbinlog/)
Как сделать правильно? – статика
• Нефатальное количество файлов – архивация и копирование
Как сделать правильно? – статика
• Нефатальное количество файлов – архивация и копирование
• Не хватает места, много данных – tar + stream
tar czhf - /home/bitrix/www/ —exclude=bitrix/managed_cache —
exclude=bitrix/stack_cache —exclude=bitrix/cache | ssh $SSH "cat -> ${RPATH}/${FN}" \;
»$LOG 2>&1 || die_if_tar_failed files_tar
Как сделать правильно? – статика
• Нефатальное количество файлов – архивация и копирование
• Не хватает места, много данных – tar + stream
tar czhf - /home/bitrix/www/ —exclude=bitrix/managed_cache —
exclude=bitrix/stack_cache —exclude=bitrix/cache | ssh $SSH "cat -> ${RPATH}/${FN}" \;
»$LOG 2>&1 || die_if_tar_failed files_tar
• Большой объем данных – rsync на бэкапный сервер (без delete)
Как сделать правильно? – статика
• Нефатальное количество файлов – архивация и копирование
• Не хватает места, много данных – tar + stream
tar czhf - /home/bitrix/www/ —exclude=bitrix/managed_cache —
exclude=bitrix/stack_cache —exclude=bitrix/cache | ssh $SSH "cat -> ${RPATH}/${FN}" \;
»$LOG 2>&1 || die_if_tar_failed files_tar
• Большой объем данных – rsync на бэкапный сервер (без delete)
• Есть резерв – lsyncd на резервный сервер без delete
Как сделать правильно? – конфиги
• git autocommit /etc директории
Как сделать правильно? – конфиги
• git autocommit /etc директории
• составляем список всего что надо бэкапить (кроны, конфиги) и
бэкапим
Как сделать правильно? – конфиги
• git autocommit /etc директории
• составляем список всего что надо бэкапить (кроны, конфиги) и
бэкапим
• Совсем по хорошему – управление конфигурацией
Как сделать правильно? – конфиги
• git autocommit /etc директории
• составляем список всего что надо бэкапить (кроны, конфиги) и
бэкапим
• Совсем по хорошему – управление конфигурацией
Как сделать правильно? – мониторинг
• Бэкап ломается раз в 29 дней. Если вы его не проверяли - весьма
вероятно что он уже сломан.
Как сделать правильно? – мониторинг
• Бэкап ломается раз в 29 дней. Если вы его не проверяли - весьма
вероятно что он уже сломан.
• Мониторим сервер во время создания бэкапа (место на диске,
доступность сайта)
Как сделать правильно? – мониторинг
• Бэкап ломается раз в 29 дней. Если вы его не проверяли - весьма
вероятно что он уже сломан.
• Мониторим сервер во время создания бэкапа (место на диске,
доступность сайта)
• Мониторим вывод логов бэкапных скриптов (innobackupex:
completed OK!)
Как сделать правильно? – мониторинг
• Бэкап ломается раз в 29 дней. Если вы его не проверяли - весьма
вероятно что он уже сломан.
• Мониторим сервер во время создания бэкапа (место на диске,
доступность сайта)
• Мониторим вывод логов бэкапных скриптов (innobackupex:
completed OK!)
• Мониторим размер залитых бэкапов (слишком маленькие –
алерт)
Как сделать правильно? – мониторинг
• Бэкап ломается раз в 29 дней. Если вы его не проверяли - весьма
вероятно что он уже сломан.
• Мониторим сервер во время создания бэкапа (место на диске,
доступность сайта)
• Мониторим вывод логов бэкапных скриптов (innobackupex:
completed OK!)
• Мониторим размер залитых бэкапов (слишком маленькие –
алерт)
• Мониторим изменение размера залитых бэкапов (не меняется –
алерт)
Как сделать правильно? – мониторинг
• Бэкап ломается раз в 29 дней. Если вы его не проверяли - весьма
вероятно что он уже сломан.
• Мониторим сервер во время создания бэкапа (место на диске,
доступность сайта)
• Мониторим вывод логов бэкапных скриптов (innobackupex: completed
OK!)
• Мониторим размер залитых бэкапов (слишком маленькие – алерт)
• Мониторим изменение размера залитых бэкапов (не меняется – алерт)
• Мониторим последнюю дату залитых бэкапов (не было больше суток –
алерт)
Как сделать правильно? – мониторинг
• Бэкап ломается раз в 29 дней. Если вы его не проверяли - весьма
вероятно что он уже сломан.
• Мониторим сервер во время создания бэкапа (место на диске,
доступность сайта)
• Мониторим вывод логов бэкапных скриптов (innobackupex: completed
OK!)
• Мониторим размер залитых бэкапов (слишком маленькие – алерт)
• Мониторим изменение размера залитых бэкапов (не меняется – алерт)
• Мониторим последнюю дату залитых бэкапов (не было больше суток –
алерт)
Как сделать правильно? – контроль
• Не верим роботам
Как сделать правильно? – контроль
• Не верим роботам
• Проверка возможности распаковать архив
Как сделать правильно? – контроль
• Не верим роботам
• Проверка возможности распаковать архив
• Проверка времени распаковки
Как сделать правильно? – контроль
• Не верим роботам
• Проверка возможности распаковать архив
• Проверка времени распаковки
• Проверка того что в бэкап входит все что нужно
Как сделать правильно? – контроль
• Не верим роботам
• Проверка возможности распаковать архив
• Проверка времени распаковки
• Проверка того что в бэкап входит все что нужно
• Попытка поднять БД
Как сделать правильно? – контроль
• Не верим роботам
• Проверка возможности распаковать архив
• Проверка времени распаковки
• Проверка того что в бэкап входит все что нужно
• Попытка поднять БД
• Попытка поднять сайт
Как сделать правильно? – bonus track
• Не проверенный бэкап – не бэкап
Как сделать правильно? – bonus track
• Не проверенный бэкап – не бэкап
• Реплика – не бэкап
Как сделать правильно? – bonus track
• Не проверенный бэкап – не бэкап
• Реплика – не бэкап
• Сделать правильно на старте проще чем сделать правильно
потом
Как сделать правильно? – bonus track
• Не проверенный бэкап – не бэкап
• Реплика – не бэкап
• Сделать правильно на старте проще чем сделать правильно
потом
• Все равно очень страшно
Евгений Потапов
http://facebook.com/eapotapov
[email protected]
http://itsumma.ru
Скачать