Система управления ЦОД
Современный ЦОД – это огромное количество разноплановых ресурсов, размещающихся на различных площадках и взаимодействующих друг с другом в рамках критичных для бизнеса транзакций. Система управления всеми этими процессами должна работать буквально «как швейцарские часы». Какой должна быть система диагностики и профилактики «здоровья» ЦОДа, чтобы современные корпоративные информационные системы никогда не болели?
Статья входит в обзор "Технологии для ЦОД"
Содержание |
Корпоративные ЦОДы превращаются в ценный актив предприятия. И не только потому, что в стенах Data-центра установлено огромное количество дорогостоящего оборудования, которое порождает существенные операционные затраты в виде платы за электроэнергию. В ЦОДе работают критичные для бизнеса приложения. Это означает, с помощью правильно организованной системы мониторинга и управления ресурсами ЦОДа (Data Center Infrastructure Management, DCIM) можно добиться, с одной стороны, снижения операционных затрат, а, с другой стороны, поддерживать непрерывную работоспособность и доступность приложений для любых масштабов нагрузки. В широком смысле системы DCIM помогают предприятиям достигать стратегических бизнес-целей.
Комплексная сущность DCIM
Символом современных корпоративных ИТ-систем является интеграция. В этом смысле DCIM становится тесно интегрированной с процессами и системами управления ИТ (ITSM), включая управление изменениями и управление конфигурационными базами данных (CMDB). Фактически DCIM становится структурой, консолидирующей в единое управляемое пространство, как данные о физической инфраструктуре ЦОД (вплоть до потребляемой электроэнергии), системной ИТ-инфраструктуре, так и данные, связанные с бизнес-приложениями.
Основой «здоровья» ЦОД является Автоматизированная система диспетчерского управления (АСДУ). Без данной системы ЦОД, в общем-то, не жизнеспособен. Именно она связывает десяток систем в единый организм,- говорит Владимир Леонов, технический директор АМТ-ГРУП.- Данный инструмент осуществляет, как текущую эксплуатацию, так и диагностику и прогноз событий и, соответственно, дает все инструменты для анализа и принятия корректных решений. |
Фактически DCIM создает единую интегрированную среду мониторинга и управления, которая объединяет потоки данных из максимально доступного количества источников. Информация собирается и обрабатывается в реальном времени, что дает обслуживающему персоналу полную картину функционирования всех подсистем Data-центра.
Современные DCIM системы могут моделировать различные ситуации без физического переключения оборудования. С этой же целью используются системы SDN-коммутации, так как они позволяют оптимизировать коммутацию трафика под потребности приложений, что ведет к лучшей утилизации ресурсов и системы виртуализации,- отмечает Владимир Леонов и добавляет: Важнейшей системой является система инвентаризации. Она учитывает все оборудование, установленное в ЦОДе: от инженерных систем до систем виртуализации. |
Наличие детальной и полной информации по разным аспектам функционирования ЦОДа создает фундамент для автоматизации процессов обработки этих данных.
Современные системы DCIM позволяют снизить влияние человеческого фактора за счет автоматизации заявок на проведение работ по модернизации и предварительной проверки работоспособности до проведения работ, учет электропитания и совместимости оборудования между собой,- подчеркивает Владимир Леонов. |
DCIM или DMaaS?
Изначально системы DCIM были локальными, но в последнее время на рынке появились облачные варианты. В компании Schneider Electric говорят, что для флагманского продукта управления EcoStruxure IT есть предусмотрены оба варианта: облачный и on-premise, но компания более склонна к первому варианту, поскольку у него более обширный функционал. Действительно, в облаке удобнее запускать мощное ПО аналитики больших данных, которое анализирует состояние всех элементов ИТ-инфраструктуры на предмет ожидаемого сбоя.
В настоящее время возможности по удаленному мониторингу основного оборудования инженерной инфраструктуры (ИБП, ДГУ, чиллеры, кондиционеры), его самодиагностике, автоматическому вводу резервных компонентов на замену аварийным являются фактически отраслевым стандартом,- отмечает Илья Царев, архитектор Центра разработки решений для ЦОД компании Schneider Electric. |
Он поясняет, что клиентам также доступны системы автоматического регулирования производительности систем холодоснабжения в зависимости от изменения потребления нагрузки. В частности, система SE Active Flow Controller регулирует производительность кондиционеров Inrow по воздуху в зависимости от условий в конкретном контейнеризованном ряду стоек.
Помимо DCIM, на рынке появилась ее вариация DMaaS (Datacenter Management as a Service, управление Data-центром как услуга). Это облачный сервис, основанный на программном обеспечении DCIM. Однако он не является просто другой формой предоставления функциональности DCIM. Концепция DMaaS выводит процесс сбора и обработки данных об инфраструктуре ЦОД на качественно новый уровень: данные об оборудовании и устройствах собираются из множества центров обработки данных, а затем консолидируются и совместно анализируются.
Некоторые разработчики услуг такого класса добавляют в свои DMaaS-решения поддержку анонимизированного анализа данных разных клиентов. Такой подход позволяет выявлять тренды и формировать эффективные аналитические решения на основании реально больших клиентских данных. Например, так поступает американская компания Equinix, владеющая глобальной сетью ЦОДов в разных странах мира.
Ее собственная DCIM IBX SmartView собирает в режиме реального времени сведения об основных параметрах работы всех ЦОД, информирует каждого клиента о состоянии его физической инфраструктуры, энергопотреблении, температуре в помещениях и других важных для арендаторов параметрах, а в случае необходимости формирует аварийные оповещения. Для прогнозирования и предотвращения инцидентов и сбоев используется информация, поступающую из множества центров обработки данных.
Здесь открывается широкое поле для экспериментов в области интеллектуальных методов предиктивной аналитики для прогнозирования вероятных сбоев, нехватки мощностей, а также для выявления неэффективности при использовании тех или иных ресурсов.
Как полагают в Schneider Electric, сервисы DMaaS расширяют возможности служб эксплуатации и открывают доступ к функциональности DCIM даже для небольших ЦОД, которые раньше не могли позволить себе применение таких ИТ-систем.
По мнению ряда экспертов, эта особенность DMaaS может в будущем существенно трансформировать управление Data-центрами. Однако до того системам DMaaS предстоит еще пройти достаточно длительный путь развития, ведь по полномасштабной интеграции всех ресурсов ЦОД еще далеко.
По сути, DMaaS должна интегрировать управление физической инфраструктурой ЦОДа с многими другими сервисами, в том числе, с сервисами управления рабочими ИТ-нагрузками, управления электроэнергией, организации связи, а также управлением затратами. На все это требуется время. Зато в будущем тотальная интеграция управления всеми ресурсами ЦОД откроет еще одно мощное направление развития – анализ всевозможных бизнес-параметров на базе аккумулируемых данных. По крайней мере, такого развития событий ожидают аналитики исследовательской компании 451 Research.
Одновременно будет развиваться параллельная тенденция – все больше значимых инфраструктурных компонентов и сервисов — от резервного энергоснабжения до собственно емкости ЦОДов — будут потребляться по сервисной модели и оплачиваться по принципу pay-as-you-go.
DCIM на периферии
Появление многочисленных периферийных и микроЦОДов, которое ожидается в ближайшем будущем, порождает потребность в более совершенных решениях для управления инфраструктурой ЦОД, в том числе с возможностью их использования в децентрализованных средах.
Актуальная тенденция в этой части – развитие индустрии быстровозводимых ЦОДов высокой заводской готовности, которые обычно создаются по модульному принципу на основе модулей высокой заводской готовности (Prefabricated Data Center Modules). Такие модули, сборка и наладка которых осуществляются в заводских условиях, содержат, в числе прочего, предустановленные элементы DCIM.
Соответственно получила развитие тенденция создания модульных DCIM-решений. Принцип их компоновки исходит из практических потребностей: вначале реализуются задачи мониторинга и управления, имеющие самый высокий приоритет. Модульные DCIM-решения позволяют внедрять систему поэтапно, что оптимизирует трудоемкость внедрения и стоимость работ.
DCIM в мире Интернета вещей
Глобальный тренд информатизации предприятий очевиден – все больше элементов инженерной инфраструктуры снабжаются умными датчиками, которые позволяют осуществлять удаленное управление инфраструктурными элементами. В условиях крупных территориально-распределенных сетей ЦОДов это приводит к появлению новых сущностей - виртуальных диспетчерских, предназначенных для управления всей инженерной инфраструктурой. Фактически то, что сегодня принято называть Интернетом вещей, уже реализуется в том или ином виде в современных системах DCIM.
Однако IoT в ЦОД — это не только сами датчики. Главная часть решения – предиктивная аналитика, которая позволяет анализировать события, происходящие в инфраструктуре ЦОД, и прогнозировать их возможное развитие. Для того чтобы формализовать описания соответствующих процессов, используются их математические модели. А сама методология применения Интернета вещей к задачам DCIM включает модели управления, основанные на данных (Data-Driven Model).
Управление на основе данных становится одним из перспективных направлений развития современных центров обработки данных. Детальность и чувствительность таких решений позволяет строить тонкие прогностические модели не только на уровне целых устройств и систем, но и на уровне, скажем, параметров качества обслуживания, указанных в SLA.
Новый подход к сбору данных, необходимых для управления инфраструктурой ЦОД в стиле Интернета вещей, положен, например, в основу сервисов AWS IoT, которые призваны упростить создание клиентских приложений для Интернета вещей. Управляемая облачная платформа AWS IoT Core обеспечивает взаимодействие подключенных устройств, как с облачными приложениями, так и с другими устройствами. Она рассчитана на массовые индустриальные приложения и, по заверениям разработчиков, способна поддерживать «миллиарды устройств, обрабатывать и маршрутизировать триллионы сообщений».
В целом сегмент DCIM и DMaaS не является целевым для AWS IoT, по крайней мере на настоящий момент. Однако такие сервисы способны оказать влияние на облик DMaaS-решений для распределенных сред и, возможно, станут источником вдохновения для разработки альтернативных предложений, способных составить конкуренцию продуктам традиционных поставщиков DCIM.
Оценка активов конвергентной инфраструктуры
DCIM-модель, точно отражающая актуальную ситуацию с инфраструктурным оборудованием, - это отличное «лекарство» от «головной боли» многих нынешних ЦОДов, владельцы которых при учете ИТ-оборудования и систем полагаются частично на данные нишевых систем мониторинга, частично – на Excel-таблицы, а частично – на сведения из бумажных журналов, которые сотрудники ведут вручную.
Интеграция данных из различных источников учета активов – это естественный этап на пути к единой DCIM-модели, который включает и ITSM-интеграцию, и интеграцию с системой виртуализации, а также с всеми остальными локальными технологиями, развернутыми на площадке ЦОДа. В любом случае результатом станет повышение точности, актуальности и достоверности данных DCIM-моделей Data-центров.
Современные решения позволяют гибко управлять ресурсами на основании как собираемой в реальном времени информации мониторинга (энергопотребления, температурных режимов), так и данных о местах установки того или иного оборудования и взаимосвязях в их работе,- замечает Сергей Махлин.- Если несколько лет назад заказчики с осторожностью внедряли такие решения, зачастую считая их неоправданной тратой средств, то сейчас все больше и больше ИТ-команд осознают их полезность и внедряют у себя эти решения. |
По сути, речь идет о том, что управлением корпоративным ЦОДом становится все более интеллектуальным. Правда, процесс этого «поумнения» идет неоднородно, отмечает Сергей Мищук, директор по продуктовому развитию в области ЦОД и облачных сервисов в «Ростелеком-ЦОД»:
Объем данных в информационных системах растет, но не всегда получается эффективно использовать эти данные. |
Он объясняет, почему так происходит:
К сожалению, чем больше данных мы собираем, тем больше объем информационного шума. Тем труднее извлечь осмысленную информацию, представляющую ценность для службы эксплуатации и бизнеса в целом. |
Но позитивные примеры есть.
Умное управление системами ЦОДа
В решении компании Delta датчики EnviroProbe способны измерять температуру и влажность, как в отдельных стойках, так и в каждом помещении ЦОД. Кроме того, каждая станция EnviroProbe обеспечивает подключение до четырех дополнительных датчиков, счетчиков или сенсоров, фиксирующих, например, задымленность, протечки, открытие или закрытие дверей и другие события. Сигналы с этих датчиков могут передаваться в режиме реального времени на экран управляющего приложения InsightPower Manager или непосредственно ИТ-специалистам на мобильные устройства, где бы они ни находились.
А комплексное решение InfraSuite Manager способно отслеживать состояние всей инфраструктуры ЦОД. Открытая архитектура позволяет подключать источники бесперебойного питания (ИБП), распределительные узлы (PDC) и блоки распределения питания (PDU), модульные стойки, устройства прецизионного охлаждения, генераторы и многие другие устройства, состояние которых необходимо отслеживать. Иными словами, InfraSuite Manager представляет собой законченную кросс-системную платформу для отслеживания всех аспектов состояния компонентов инфраструктуры ЦОД.
Другой пример - платформа для мониторинга и управления инфраструктурой ЦОД Schneider Electric EcoStruxure IT. Аппаратный комплекс датчиков, контроллеров подключаемых устройств, контроллеров системы мониторинга проводит сбор и первичную обработку состояния ключевых инженерных систем ЦОД (в первую очередь систем электро- и холодснабжения), климатических параметров в помещении, а также добавляет информацию в части физической безопасности (видеонаблюдение, контроль состояния дверей и т.п.). На программном уровне эта информация собирается, обрабатывается и визуализируется с помощью ПО EcoStruxure IT Expert, которое развертывается в облаке, либо ПО StruxureWare Data Center Expert (развертывается на локальном сервере). Анализ информации, планирование и моделирование изменений осуществляются в пакете EcoStruxure IT Advisor, либо Struxureware Data Center Operation. А продукт EcoStruxure Asset Advisor представляет собой сервис удаленного мониторинга состояния ключевых инженерных систем ЦОД.
Пожалуй, самый яркий пример – аккумуляторные батареи источников бесперебойного питания: на основании данных о температуре в помещении, о количестве циклов заряда-разряда, возрасте, современные системы мониторинга с высокой степенью точности могут предсказывать оставшееся время жизни батареи,- приводит пример Сергей Махлин, руководитель электроснабжения и климатических систем ИТ-компании КРОК. |
Причем, облачные технологии помогают здесь использовать не только статистику собственного «железа», но и обезличенную информацию, накопленную с сотен объектов по всему миру.
Точность таких предсказаний соответственно существенно повышается,- добавляет эксперт. |
Другой пример - ПО Delta InsightPower Manager. Оно использует устанавливаемое на серверах клиентское приложение, которое собирает данные со всех ИБП. При внезапном отключении питания приложение принудительно завершает работу операционной системы, в том числе и на виртуальных машинах, обеспечивая тем самым нормальные условия для сохранения критически важных данных.
Сегодня организации начинают активно использовать системы искусственного интеллекта для раннего предупреждения о возможных авариях и рекомендаций по их профилактике на основе обучения нейросетей по статистике работы оборудования. Основная цель таких систем - обеспечить надежность работы ЦОДа на высочайшем уровне,- отмечает Владимир Леонов из АМТ-ГРУП. |
Интересный пример использования методов искусственного интеллекта в работе ЦОДов демонстрирует Google. Компания использует алгоритм, который способен обучаться управлению системами охлаждения Data-центра с целью снижения потребления электроэнергии. Запланированная отдача от проекта — экономия электроэнергии до 40% от привычного уровня. Летом 2018 г. руководство Google объявило о передаче алгоритму контроля за управлением этой частью инженерных систем своих ЦОДов. Впрочем, о полном устранении человека из задач управления речь не идет – работу умного алгоритма контролирует человек, который реагирует на обнаруженные системой признаки странного подозрительного поведения.
Несмотря на всю привлекательность применения интеллектуальных методов управления в Data-центрах, о массовом их применении говорить рано. Сегодня масштаб их распространения оценивается Gartner всего в 5% от общего числа ЦОДов в мире. Правда, к 2022 г. ожидается рост до 40%.
Технологии искусственного интеллекта или интернета вещей сейчас на пике популярности, но пока ничего из этого в ЦОДах не работает. Все остается на уровне экспериментов с модной технологией, но не дает качественного прироста. Эффект дают уже известные технологии при грамотном и последовательном внедрении,- говорит Сергей Мищук. |
А Роман Шумейко, начальник отдела поддержки продаж системного интегратора «ХайТэк», замечает:
Значительную роль играют такие параметры, как стоимость и «умность» подобных устройств. На мой взгляд, многие решения производителей найдут свою нишу на рынке ЦОД и будут востребованы. В основном, существующие сегодня технологии для вычислительных центров так или иначе удовлетворяют современным требованиям. |
С учетом всего сказанного понятно, что общая политика в области управления Data-центром будет меняться в направлении полной прозрачности и унификации модулей ЦОД, операций? как инженерного блока, так и непосредственно ИТ-сервисов в частных и публичных облаках. Только так в складывающихся условиях можно получить необходимое качество сервисов и точную достоверную оценку эффективности Data-центра.
Автоматизация управления системами ЦОД
О роли человеческого фактора в управлении ЦОДом говорит Артем Кузнецов, руководитель планово-экономической службы компании «АРБИТЕК» (ГК «АйТеко»):
Наиболее важным аспектом на данный момент является человеческий фактор, а именно квалификация персонала, который в дальнейшем будет обслуживать центр обработки данных. Зачастую все самые продвинутые технологические решения пасуют из-за не вовремя проведенных профилактических работ или недостаточных компетенций в части внедрения и поддержания автоматизации процессов. |
Не случайно среди ключевых трендов развития ЦОД в 2020 году в своем исследовании Data Center Industry Survey Results специалисты Uptime Institute назвали автоматизацию и диспетчеризацию управления ЦОДом.
Илья Царев перечисляет, в каких сферах функционирования ЦОД сегодня используется автоматизация процессов управления с помощью продуктов класса DCIM:
- Визуализация состояния инженерных систем, температурно-влажностного режима в помещениях ЦОД, сигналов предупреждения и аварии в режиме реального времени.
- Удаленное управление основными компонентами инженерных систем.
- Учет и автоматизированное планирование использования доступных ресурсов.
- Учет потребляемых ресурсов.
- Инструменты аналитики, включая предиктивный анализ состояния оборудования и выдачу рекомендаций по проведению обслуживания и изменений в системе.
- Интеграция с системами управления предприятием, системами управления сервисным обслуживанием, клиентскими сервисами.
- Автоматизация управления службой эксплуатации, контроль действий персонала, систему тикетов на выполнение операций.
- Развитая многоуровневая система доступа к ресурсам с индивидуальной настройкой доступа, типа и порядка оповещений для специалистов и руководства различного уровня и профиля.
Он говорит также о готовности к интеграции с перспективными системами управления и контроля, в частности использующими дополненную реальность и мобильные персональные средства информирования (смартфоны, очки AR и т.п.).
Мы считаем, что наиболее перспективен системный подход к автоматизации,- подчеркивает Сергей Мищук. |
Он выделяет в автоматизации ЦОДа два уровня. Первый - это инженерные системы.
Их автоматизация может повлиять на отказоустойчивость Data-центра,- рассказывает эксперт. Например, в Data-центре уровня Tier IV переключения между основными и резервными элементами инженерных систем автоматически. |
Второй уровень автоматизация ЦОДа подразумевает автоматизацию процессов.
Часто это даже более важный уровень, так как автоматизация инженерных систем работает только вместе с налаженными процессами,- отмечает Сергей Мищук.- В первую очередь, это автоматизация процессов технического обслуживания и ремонтов. Например, в наших Data-центрах внедряются решения для мобильной работы с картами и программами технического обслуживания. |
Это означает, что инженеры смогут прямо со своих планшетов и смартфонов открывать графики техобслуживания, чек-листы и сразу фиксировать результаты работ в системе управления техническим обслуживанием оборудования (Maintenance Management System, MMS).
С темой автоматизации процессов тесно связаны те вопросы эффективности Data-центра, которые уходят в область управления изменениями. Эксперты говорят, что если изменения параметров системы производятся с помощью системы управления изменениями, а она является составной частью DCIM, то эта DCIM-модель всегда будет оставаться точным слепком самого физического Data-центра, а значит, сможет поддерживать его в оптимизированном состоянии с помощью автоматизированных процессов.
Илья Хала, генеральный директор сети дата-центров 3data, рассказывает:
За 10 лет работы мы разработали собственную комплексную систему монинторинга и управления, которая следит за всеми возможными параметрами работы ЦОДов. Это система также обеспечивает автоматизацию основных процессов эксплуатации. Но совершенству нет предела, мы постоянно занимаемся развитием и «безлюдный» ЦОД — это сверхзадача, к решению которой мы стремимся. |
Безлюдный ЦОД
Голубая мечта отрасли ЦОД — полностью автоматизированная эксплуатация центров обработки данных, в которых за ненадобностью можно выключить все освещение. Благодаря программно-определяемым решениям, интеллектуальным алгоритмам и механизмам автоматизации эта мечта становится ближе к реальности. Так, исследовательская компания 451 Research даже ввела недавно в обиход термин «ЦОД как машина», обозначив так необслуживаемые площадки ЦОД, которыми можно дистанционно управлять как настольным компьютером.
Илья Хала видит воплощение мечты несколько по-другому:
В конечном итоге ЦОД должен стать подобием банковской ячейки или камеры хранения. Ты можешь один посетить Data-центр, сделать все необходимые действия и спокойно уйти. |
Станислав Мирин, руководитель направления ЦОД iKS-Consulting, полагает, что уже сегодня можно говорить о том, что бизнес ЦОДов – это малолюдный бизнес с высокой производительностью труда:
Штат в несколько десятков человек обеспечивает возможность генерировать миллиардную выручку, что сопоставимо с производительностью труда в лучших нефтяных компаниях. В этом смысле «данные – это новая нефть». |
По мнению эксперта, проекты необслуживаемых ЦОДов реализуются уже сегодня - в космосе или под водой, но все это пока экзотические примеры.
Полагаю, что совсем отказываться на земле от людей не следует, но автоматизировать в ЦОДах еще есть что,- замечает Станислав Мирин. |
Роман Шумейко, начальник отдела поддержки продаж системного интегратора «ХайТэк», считает, что к реализации идеи необслуживаемого ЦОДа надо стремиться, однако реализовать подобное на практике не всегда возможно.
В первую очередь, это связано со стоимостью и надежностью данного решения, хотя уже есть яркие примеры затопляемых необслуживаемых ЦОД»,- поясняет он. |
Инженерная инфраструктура в хорошем ЦОДе должна быть максимально автоматизирована, тогда как численность персонала должна оставаться минимальной, соглашается Роман Шумейко, но обращает внимание на то, что сегодня для учета, контроля и прогноза требуемых ресурсов многие производители компонентов для ЦОД предлагают авторский облачный мониторинг собственных решений.
Насколько это эффективно, покажет время,- говорит Роман Шумейко. |
Говоря о возможности создания роботизированного, «безлюдного» ЦОДа, Илья Царев выделяет два направления. Первое – стремление обеспечить максимальную автономность мини- и микроЦОДов Edge-архитектуры, которые изначально находятся вдали от служб эксплуатации и вообще квалифицированного персонала.
Здесь продолжают наращиваться возможности системы удаленного мониторинга и управления, физическая защищенность таких комплексов, общая надежность и автономность системы, снижающие потребность в периодических проверках и обслуживании таких миниЦОД к минимуму,- отмечает эксперт. |
Второе направление - крупные центральные ЦОДы, которые физически представляют собой контролируемую упорядоченную среду.
В настоящее время эта среда проходит очередной цикл унификации благодаря внедрению конвергентных и гиперконвергентных решений в части ИТ-систем, а также расширению использования такой унифицированной платформы, как OCP,- говорит Илья Царев. |
При этом в части инженерных систем наращивается количество и тип подключаемых к системам удаленного мониторинга и управления устройств.
Все вместе это создает благоприятную среду для роботизации отдельных операций в ЦОД (контроль состояния оборудования и коммуникаций, замена отдельных блоков и узлов, переключения в системах без участия человека),- полагает Илья Царев. |
Он предполагает, что в перспективе ЦОД как техническая архитектура может пойти путем, схожим с тем, что был пройден крупными складами: – от полностью ручного труда через механизацию и автоматизацию к безлюдному роботизированному складу.
Технически сейчас ничто не мешает, по крайней мере, в whitespace перейти к «безлюдному» производству, перемещая, подключая и обслуживая стандартизованные по размеру и интерфейсу ИТ-устройства и элементы инженерных систем уровня стоек и зала. Однако в коммерческом плане целесообразность такой роботизации, вероятно, наступит нескоро,- размышляет Илья Царев. |
Сергей Махлин предлагает различать ситуации двух типов:
Возможен ли автономно управляемый автомобиль? Уже сегодня - да. Возможен ли необслуживаемый? Конечно, нет. Как любой комплекс интегрированных инженерных решений, ЦОД должен регулярно обслуживаться, и от качества и своевременности этого обслуживания зачастую зависит его надежность. |
Он подчеркивает, что современные решения по мониторингу направлены раз на повышение качества обслуживания ЦОД:
Важно не только вовремя провести плановое ТО, но и выполнить предупредительные ремонты критически важного оборудования. На основании накопленной (как своей, так и внешней) статистики алгоритмы позволяют оценить степень старения оборудования, что, в свою очередь, позволяет запланировать его ремонт или замену изнашивающихся элементов. |
Александра Эрлих, генеральный директор компании «ПрофАйТиКул», также приводит пример с автомобилем:
ЦОД в этом плане как автомобиль: мне очень комфортно, что моя машина и двери сама закроет, и препятствие увидит раньше меня, и затормозит в критической, по ее мнению, ситуации, даже если я этого не хочу. Всегда страшно, что произойдет, если система вдруг откажет или даст сбой. Поэтому даже при парковке я доверяю камере и парктроникам, но смотрю в зеркала. |
Истории о том, как робот передвигается по ЦОДу по заданному алгоритму и считывает параметры с датчиков, уже стали реальностью напоминает Константин Зиновьев, директор отделения инженерной инфраструктуры компании Rubytech. Однако полностью отказаться от людей в Data-центрах в ближайшие 10 - 15 лет не получится, считает эксперт, ведь ряд процессов просто невозможно осуществлять без квалифицированных ИТ-инженеров.
Если на уровне создания софта заменить человека уже можно, то на уровне обслуживания аппаратной части пока невозможно,- говорит Константин Зиновьев.- Так что, сегодня речь идет только лишь о цифровом строительстве ЦОДов. Что же касается их цифрового обслуживания, то говорить о нем мы сможем лишь на следующем этапе трансформации модели создания ЦОДов». |
Что это за следующий этап?
Цифровую трансформацию должна претерпеть сама модель строительства ЦОДов, объясняет Константин Зиновьев:
Пока мы не перейдем к цифровой модели строительства и эксплуатации Data-центров с применением BIM, реализовать полноценный мониторинг «здоровья» ЦОД будет невозможно. Если у нас не будет корректной цифровой модели ЦОД со всеми параметрами оборудования и показателями, то настроить роботизированный контроль мы не сможем. |
А на текущем этапе владельцы ЦОДов постепенно внедряют новые подходы к построению ЦОДов в свои цифровые модели. Процесс этот достаточно длительный – по оценкам Константина Зиновьева, только переход на цифровую модель построения ЦОДов займет не менее 10 лет.
Где прячется экономическая эффективность ЦОДа ближайшего будущего?
По мнению Станислава Мирина, важную роль в росте экономической эффективности Data-центров, играет, во-первых, внедрение различных систем мониторинга в ЦОДах, которое исключает простой оборудования, ведет учет используемых вычислительных мощностей и систем хранения данных. Во-вторых, гомогенная структура вычислительного оборудования, специально сконструированная для использования в ЦОДах, позволяет поднимать температуру в ЦОДе, а значит активнее использовать фрикулинг и отказываться от затрат на дополнительное охлаждение. В третьих, отрасль надеется на изменение законодательства, в результате которого крупные ЦОДы смогут напрямую подключаться к генерируемым мощностям, что позволит снизить стоимость электроэнергии для Data-центров.
Илья Царев также обращает внимание на регуляторные идеи в части энергопотребления:
Следует обратить внимание на развитие некоторых инициатив в российской энергетике, которые могут принести выгоду владельцам крупных и даже средних ЦОД в случае технической готовности их объектов. Речь идет о таких развивающихся программах, как гарантия уровня отбора мощности на следующие сутки и снижение потребления по требованию сетевого оператора. |
Подобные меры приводят к общей экономии участников рынка электроэнергии за счет большей предсказуемости потребления и отсутствия необходимости держать крупные резервные генеририрующие мощности. ЦОД вполне может участвовать в подобных программах, считает эксперт, за счет в целом стабильного уровня потребления ИТ-систем и наличия локальной генерации.
Например, дизель-генераторные установки в любом случае нужно периодически «прожигать» для проверки исправности и «естественного» обновления дизельного топлива в хранилище.
Почему бы не делать это именно в период, требуемый сетевым диспетчером, чтобы снизить сетевое потребление объекта «от города»?- задается вопросом Илья Царев. |
Он также упоминает о возможностях передовых ИБП по снижению потребления «от города» за счет функции peak shaving, то есть с частичным питанием нагрузки от своего батарейного массива.
В частности, такой функцией обладает ИБП Galaxy VX. В случае использования современных литий-ионных аккумуляторов с большим количеством циклов заряда-разряда, периодическое применение такой функции в целом не скажется на ресурсе системы,- замечает специалист. |
Сергей Махлин также говорит об экономии энергопотребления:
Очевидно, чтобы сократить затраты на эксплуатацию ЦОД, нужно уменьшать потребление основного ресурса – электроэнергии. Два главных ее потребителя – ИТ-оборудование и система холодоснабжения. Решения класса DCIM – data center infrastructure management – призваны отслеживать состояние, измерять и управлять потреблением как оборудования ИТ-инфраструктуры (серверов, СХД, коммутаторов), так и оборудования инженерной инфраструктуры (кондиционеров, панелей распределения питания). |
Владимир Леонов разделяет вопрос повышения экономической эффективности на две части. Так, капитальные затраты на единицу хранения и передачи данных, в основном, зависят от размера ЦОДа: чем он больше, тем приведенная себестоимость на условную единицу данных ниже. Сюда же можно отнести стоимость непосредственно строительства и подведения инженерных сетей, например, стоимость электроэнергии.
Именно поэтому ЦОДы обычно строят, используя близость электрогенерирующих объектов, например, ГЭС или там, где уже есть избыточная мощность,- замечает эксперт. |
А снижение эксплуатационных затрат, в первую очередь, зависит от внедрения современных систем управления и автоматизации АСДУ и систем учета инфраструктуры ЦОД.
По оценкам компании «СДИ Софт», решения которой мы используем более чем в 600 заказчиках, DCIM-системы позволяют оптимизировать работу ЦОД примерно на 20% за счет оптимизации работы персонала, снижения требований к его квалификации, оптимизации размещения оборудования и электропитания,- дает оценку Владимир Леонов. |
Павел Горюнов, технический директор сети дата-центров КРОК, говорит о наиболее популярных методах повышения экономической эффективности ЦОДа. Например, могут использоваться различные решения с использованием промышленных решений IoT, системы мониторинга и аналитики c технологиями машинного обучения.
Не стоит забывать про вычислительное оборудование, которое постоянно прогрессирует и позволяет экономить за счет более высокой плотности размещения. И, конечно, средства виртуализации, которые помогают добиваться еще большей плотности и гибкости по использованию конечных физических ресурсов ЦОД,- отмечает Павел Горюнов. |
Сегодня многие производители ведут активные доработки своих BMS/DCIM решений, которые позволяют не только отслеживать в реальном времени состояние оборудования, но также предоставлять предиктивную аналитику для предупреждения отказов. Как следствие, удается более точно сформировать затраты.
Илья Хала говорит о позиции своей компании следующим образом:
Мы для себя определили два главных подхода в этом вопросе. Первое - это увеличение количества различных сервисов, которые доступны в наших ЦОДах, что позволяет повысить доходы. Второе - эффект масштаба. В нашем случае это означает увеличение количества площадок. Для других компаний это может быть создание более крупных ЦОДов, поглощения/слияния компаний, что тоже приводит к укрупнению рыночных игроков. Это естественный процесс повышения зрелости рынка». |
В целом, можно согласиться с мнением специалистов из Uptime Institute, которые в своем исследовании основных трендов индустрии ЦОД в 2020 году высказали мысль о том, что центры обработки данных больше не являются нишевыми или экзотическими объектами для институциональных инвесторов. Новые категории инвесторов с большими возможностями, готовые к длительным срокам возврата средств, могут существенно стимулировать развитие отрасли, говорят в Uptime Institute. И это, пожалуй, будет самой существенной новостью о ближайшем будущем корпоративных ЦОДов.