Более 4740 заметок о виртуализации и виртуальных машинах VMware, Microsoft, Citrix, Red Hat
VM Guru / Articles / VMware Site Recovery Manager – жизнь после катастрофы.
VMware Site Recovery Manager – жизнь после катастрофы.
VMware Site Recovery Manager – жизнь после катастрофы.
Автор: Александр Самойленко Дата: 04/02/2009
Реклама:
Статья:
Продукт VMware Site Recovery Manager является хорошим средством для построения отказоустойчивой виртуальной инфраструктуры серверов ESX на уровне центра обработки данных.
Основной вариант использования VMware SRM – создание резервного сайта, содержащего в себе как аппаратную, так и программную инфраструктуру, готовую принять на себя выполнение задач основного производственного окружения в случае катастрофы (например, пожар в серверной комнате). Достигается это путем репликации (синхронной или асинхронной) данных общего хранилища виртуальных машин на другой массив, географически удаленный от основной инфраструктуры. На запасном сайте также развернуто ПО VMware Virtual Infrastructure, осуществляющее запуск виртуальных машин при аварии в основном ЦОД.
В идеале, ИТ-инфраструктура должна быть готова к восстановлению в любой момент времени, поскольку форс-мажорные обстоятельства непредсказуемы, а от непрерывности ИТ-процессов зависит прибыльность, а, зачастую, и само существование компании.
VMware Site Recovery Manager позволяет создать план восстановления после сбоя (Disaster Recovery Plan), протестировать его без ущерба для задач производственной среды, а, в случае аварии, восстановить виртуальный ЦОД одной кнопкой.
Давайте теперь представим, что катастрофа произошла. Мы запустили план автоматизированного восстановления инфраструктуры VMware, и она успешно запустилась в резервном ЦОД или серверной комнате. Что делать дальше? Понятное дело – восстанавливать основной сайт. Это может быть дело одной недели, а может – нескольких месяцев. В это время инфраструктура VMware будет успешно функционировать в резервном ЦОД. Однако рано или поздно основной сайт будет восстановлен и наступит время мигрировать виртуальные машины обратно. А делать это нужно будет по следующим причинам:
Основной сайт с виртуальной инфраструктурой обычно более производителен, чем резервный. Кроме того, он обладает большими запасами отказоустойчивости по отношению к отказам отдельных хост-серверов ESX и сетевого аппаратного обеспечения.
Основной сайт более близок к бизнес-подразделениям компании, а значит быстрее реагирует на потребности бизнеса.
Кроме того, возможно потребуется «физическое» тестирование плана восстановления после сбоя (требование руководства компании), после чего нужно будет вернуть виртуальные машины обратно.
Итак, сам собой напрашивается вопрос – умеет ли VMware Site Recovery Manager делать не только failover, но и failback? Ответ, прост – ДА. Однако для реализации этого потребуется сделать несколько мероприятий:
Повернуть репликацию данных между массивами в другую сторону.
Очистить список защищаемых виртуальных машин на основном сайте.
Очистить планы восстановления, настроенные на резервном сайте (если есть).
Настроить защищаемые группы ВМ на резервном сайте.
Настроить планы восстановления на основном сайте.
Протестировать восстановление с резервного сайте на основной.
Запустить восстановление на основной сайт.
По сути процесс достаточно прост, однако, может занять некоторое время, которое надо учитывать в общей стратегии восстановления ИТ-инфраструктуры в случае аварии.
Кстати, процесс автоматизированного восстановления можно сделать и без Site Recovery Manager, однако (по оценкам самой VMware) это будет в 5 раз медленнее.