Компания: | Сервер Юнит (Server Unit) |
Защита центра обработки данных от отказов и/или от внешних воздействий является неотъемлемой частью заботы о непрерывности или даже сохранении бизнеса компании в различных условиях. В зависимости от типов обрабатываемых отказов/воздействий и технологии восстановления работоспособности различаются следующие классы систем:
- Система высокой доступности (high availability).
Обеспечивает защиту системы от аппаратных и программных сбоев и автоматическое восстановление системы в пределах единого центра данных.
- Система с полным резервированием (disaster recovery).
Наряду с защитой от сбоев отдельных компонент, обеспечивает дублирование платформы центра данных на удаленной площадке с выверенной процедурой восстановления работоспособности системы.
- Катастрофоустойчивая система (disaster tolerance).
Обеспечивает репликацию данных между двумя разнесенными центрами и автоматическое восстановление системы после катастрофы. Любая такая система представляет собой сложное комплексное решение, основными компонентами которого являются технологии, процессы, люди, услуги по настройке и технической поддержке. Пренебрежение каким-либо компонентом может поставить под угрозу надежность, эффективность и работоспособность всего решения. Основными технологическими составляющими кластерных систем являются:
- Высоконадежные аппаратные компоненты (серверы, дисковые массивы, коммутаторы и др.), содержащие встроенные функции высокой доступности, такие как избыточные источники питания и вентиляторы, диски, i/o карты и другие компоненты, поддерживающие «горячую замену».
- Кластерные архитектуры, предусматривающие отсутствие SPOF (single point of failure — единая точка отказа) — критичной компоненты системы, сбой которой вызывает остановку приложения.
- Кластерное программное обеспечение, осуществляющее контроль за всеми компонентами кластера и автоматическое восстановление системы в случае выхода из строя узлов кластера или недоступности одной из площадок центра данных.
- Репликация данных, обеспечивающая создание оперативной копии данных на удаленном дисковом массиве. Различаются два основных метода репликации — host based (средствами серверов, на которых выполняется приложение) и array based (средствами дисковых массивов основного и резервного центров).
Типовые архитектурные решения систем высокой доступности во многом аналогичны для различных серверных платформ и операционных систем. Рисунки на этой и следующей страницах представляют собой примеры соответствующих решений для локального и территориально распределенного кластеров. Технология работы кластерных систем основана на постоянном контроле за состоянием всех компонент кластера посредством специальных системных процессов. Как только один из узлов прекращает свою работу по какой-либо причине, оставшиеся узлы реформируют кластер, изолируя недоступный узел, и перезапускают прикладные задачи. Определение сбоя, диагностика системы, перенаправление информационного потока, переключение на запасной канал и другие операции выявления отказа и восстановления системы полностью автоматизированы и происходят без вмешательства оператора. В территориально распределенном кластере основной и резервный центры могут взаимодействовать как в режиме Active/Active так и в режиме Active/Standby. Используемое кластерное программное обеспечение зависит от серверной платформы, операционной системы и выбранной кластерной архитектуры. Для серверов HP Proliant сертифицированы:
- Microsoft Cluster Service (Microsoft Windows)
- Novell Cluster Service (Novell NetWare)
- HP Serviceguard for Linux + HP Serviceguard for Linux Oracle toolkit + Serviceguard Extension for SAP (Red Hat Enterprise Linux, UnitedLinux, SuSE Linux Enterprise Server)
- SteelEye's LifeKeeper for Linux (Red Hat Enterprise Linux, UnitedLinux, SuSE Linux Enterprise Server)
Для серверов HP Integrity сертифицированы:
- HP Serviceguard for Linux for Integrity (Red Hat Enterprise Linux, SuSE Linux Enterprise Server)
- HP OpenVMS Version 8.3 for Integrity Servers (OpenVMS)
- Microsoft Cluster Services for Windows® Server 2003 Enterprise and Datacenter Edition (Microsoft Windows)
- Serviceguard + Serviceguard Extension for RAC + Serviceguard Extension for SAP + Enterprise Cluster Master Toolkit + Metrocluster + Continentalcluster (HP-UX)
Последняя группа ПО сертифицирована также и для серверов HP 9000.
www.server-unit.ru