Как выстроить наилучшую стратегию создания и развития корпоративного ЦОДа. Советы экспертов КРОК
Корпоративный ЦОД сегодня – это территория постоянного развития, эволюции бизнес-решений и методов ИТ-поддержки бизнеса. О том, как меняется архитектура и ландшафт ЦОД, и как оптимизировать затраты на управление инфраструктурой дата-центров, TAdviser рассказали эксперты ИТ-компании КРОК: Александр Сысоев, руководитель направления вычислительной инфраструктуры, и Сергей Махлин, руководитель направления электроснабжения и климатических систем.
По вашим оценкам, как проявляется сегодня тенденция ухода компаний в облака, и как меняется спрос на проекты создания новых корпоративных ЦОДов?
Александр Сысоев: Если не углубляться в подробности, то можно сказать, что многие компании, действительно, предпочитают использовать облачную инфраструктуру или инфраструктуру коммерческих ЦОД для эксплуатации своих бизнес-систем. Однако если более детально рассмотреть это тренд, мы в нем увидим несколько направлений развития. Некоторые компании предпочитают не передавать данные за пределы собственного защищенного периметра без лишней необходимости. Впрочем, не желая отказываться от преимуществ облачных инфраструктур, они находят выход в строительстве частных облаков. Другие клиенты с удовольствием уходят в публичные облака. Это позволяет гибко распоряжаться инфраструктурой и снижать капитальные расходы. Госструктуры ожидаемо активно мигрируют в созданное «гособлако» или также выбирают частные облака, в том числе построенные на базе ЦОД-провайдеров, если при этом соблюдаются их требования к инфраструктуре.
Говоря об изменении отношения клиентов к форме реализации услуг ЦОД, нельзя не вспомнить о том, как повлияла на ИТ-инфраструктуру российских компаний весенняя пандемия. По опыту вашей компании, как действовали клиенты в условиях оперативного перехода сотрудников на «удаленку», и как это сказалось на задачах, связанных с обеспечением корпоративной ИТ-инфраструктуры?
Александр Сысоев: Пандемия, в первую очередь, потребовала от ИТ-подразделений в очень сжатые сроки перевести всех сотрудников в режим домашнего офиса. К счастью, для большинства крупных компаний сотрудники на удаленке - не экзотика. У многих не один десяток продавцов работает «в полях», и ИТ-директора хорошо знакомы с технологиями. Вопрос был в том, чтобы быстро адаптироваться к новым условиям и масштабировать систему. На практике речь шла о построении инфраструктуры, способной обеспечивать работу от 20 до нескольких десятков тысяч пользователей. В этой связи было необходимо оперативно нарастить вычислительные ресурсы (системы хранения данных, сервера). И почти все срочные весенние проекты, касающиеся вычислительных систем, были связаны с расширением вычислительных мощностей под удаленный доступ. Кроме этого, нужно было закупить клиентские устройства. В зависимости от компании, речь шла о 200-300, а в некоторых случаях и большем количестве ПК.
Потребовалось также продумать дополнительные меры информационной безопасности, например, внедрить систему многофакторной аутентификации, которая позволяет защититься от скомпрометированных паролей сотрудников. С вопросами информационной безопасности связан также всплеск интереса к технологиям удаленных подключений (через VDI, через VPN), которые используются, в том числе, и для обеспечения безопасной работы с корпоративной информацией. Некоторые компании построили систему на решениях класса MDM, обеспечивающих защищенный доступ к информационным ресурсам с мобильных устройств. Например, количество запросов на VDI только за первые два квартала 2020 года в два с лишним раза превысило количество запросов за весь 2019 год.
Сергей Махлин: Весна 2020 года однозначно должна войти в учебники корпоративного управления как пример невероятно быстрой перестройки работы команд, процессов, подходов к использованию инфраструктуры. По меньшей мере, свой профессионализм российские ИТ-директора точно подтвердили - большинство наших клиентов смогли оперативно перейти на удаленку. В части «инженерки» был определенный всплеск запросов, но связан он был, скорее, с вводом в эксплуатацию новых медицинских учреждений. А вот изменение ИТ-ландшафта и наращивание вычислительных мощностей каких-то масштабных перестроек инженерной инфраструктуры не потребовали.
По вашим оценкам, какой тренд сегодня заметнее: создание новых корпоративных ЦОД, возможно, небольших, периферийного уровня или модернизация, дальнейшее укрупнение и развитие существующих ЦОДов?
Сергей Махлин: Субъективно сейчас более актуально строительство новых корпоративных ЦОД. Я говорю «субъективно» потому, что крупные стройки просто лучше заметны на рынке. Да и активность по консолидации ИТ-инфраструктуры продолжается, что влечет за собой как укрупнение одних Data-центров, так и модернизацию других. Куда интереснее, на мой взгляд, менее заметный, но продолжающийся в течение нескольких лет рост объемов периферийных вычислений. Областей применения становится все больше: если раньше основными направлениями были промышленный Интернет вещей и телекоммуникации, то сейчас есть интересные реализации и в ритейле, и в коммерческом секторе, и в медицине.
Александр Сысоев: С точки зрения вычислительных систем, тренд заключается в том, что вычислительную инфраструктуру стремятся строить там, где находятся пользователи приложений. Ведь системы проектируются, исходя из потребностей заказчика, с целью эффективного решения его бизнес-задач. Скажем, если у компании большая филиальная сеть, то предпочтительнее распределить вычислительную инфраструктуру по стране, построив при этом одну большую резервную площадку. Конечно, есть примеры, когда компании последовательно занимались централизацией и децентрализаций вслед за изменениями на рынке. Но это скорее исключение. Подчеркну, что это, на мой взгляд, должно быть не вопросом моды или рыночных трендов, а осознанным подходом к построению вычислительной инфраструктуры и эффективного использования ресурсов компании.
Спрос на корпоративные ЦОДы, думается, будет оставаться в любом случае, поскольку часть компаний будет заинтересована в локальном хранении и обработке корпоративных данных. Как вы думаете, можно ли построить «идеальный ЦОД», которому затем в течение многих лет будет нужна только эксплуатационная поддержка?
Сергей Махлин: Корпоративный ЦОД корпоративному ЦОДу - рознь. Для динамично развивающихся ИТ-компаний ЦОД – это организм, который отражает быстрое развитие бизнеса. Для консервативных организаций, таких как государственные учреждения, ЦОД – это в достаточной степени стабильное образование, не требующее серьезных изменений в течение длительного периода времени, за исключением, пожалуй, запланированного масштабирования. Что касается наших заказчиков, то для них первоочередные задачи, как правило, связаны с увеличением масштаба ЦОД, повышением его надежности и с заменой морально устаревшей инженерной инфраструктуры. Последнее актуально для Data-центров, построенных десять и более лет назад.
Александр Сысоев: Снижать затраты на поддержку вычислительных систем корпоративного Data-центра можно за счет универсально применяемых решений. Мы сторонники подхода, при котором даже при очень быстро изменяющихся потребностях ИТ-инфраструктура помогает быстро и без лишних затрат перестраиваться на текущие задачи. Например, если вы используете ERP-систему «А» с определенным набором функций, а через год захотите расширить набор функций или перейти на систему «B», то на уровне вычислительной инфраструктуры не надо будет физически перестраивать систему, перенастраивать коммутацию, перераспределять жесткие диски. Все заранее готово к тому, что сегодня на вычислительных мощностях выполняются одни задачи, а завтра будут выполняться другие.
Программно-определяемая инфраструктура на основе гиперконвергентных решений облегчает такие задачи, делая всю ИТ-систему вычислительной. Это позволяет из единой программной оболочки централизованно перенастроить сеть, «перенарезать» диски, перераспределить вычислительные ресурсы и пр. При этом повышается надежность инфраструктуры, снижается стоимость владения ею. Благодаря таким решениям мы помогаем клиентам эффективно использовать ресурсы и точно планировать следующие шаги по расширению или модернизации платформ.
Если же часть бизнес-задач не удовлетворяет универсальный подход и требует нестандартных ИТ-машин (например, RISC), то здесь, конечно, не обойтись без целевых решений: от построения специальных инженерных систем до настройки бизнес-приложений.
ЦОД – это капитальное сооружение. Притча во языцех – идея снижения CAPEX такого объекта на этапе строительства и OPEХ – на этапе эксплуатации. Но какие аспекты являются ключевыми, с точки зрения максимальной экономии CAPEX и OPEX?
Сергей Махлин: Ключевые аспекты – это понимание заказчиком стоящих перед ним задач и наличие реального бизнес-плана. Если эти два пункта соблюдены, все остальное – дело техники.
Нередко мы видим желание потенциальных инвесторов войти в бизнес оператора коммерческого ЦОД. И тут важно вот что: между интересом, идеей и созданием грамотного (читай – успешного) бизнес-плана есть и другие значимые этапы. Это, например, анализ текущего рынка услуг коммерческих ЦОД в месте предполагаемого строительства и расчет ТСО (Total Cost of Ownership – это совокупная стоимость владения оборудованием с момента получения прав владения - Прим. ред.). В масштабах создания ЦОД затраты на эти этапы минимальны. Но зачастую инвесторы пренебрегают таким исследованием, и затем тратят гораздо больше на CAPEX и пытаются как-то оптимизировать OPEX.
Мы в КРОК убеждены, что без скрупулезного анализа и планирования невозможно построить такой высокотехнологичный объект как ЦОД. Оптимальное, на наш взгляд, решение - технологический консалтинг, который выполняет компания, имеющая опыт в строительстве Data-центров, сопоставимых по масштабам. Поэтому с недавнего времени мы предлагаем нашим заказчикам экспертное обоснование экономической эффективности будущего ЦОД. В него входит анализ рынка и инвестиционной привлекательности проекта, а также проработка финансовой модели, проектной документации, эксплуатационной модели, развертывание облачных и управляемых сервисов и многое другое.
Все вышесказанное относится в целом и к корпоративным ЦОД. Если на начальном этапе с помощью профессионалов трезво оценить свои ресурсы и потребности, это поможет сократить CAPEX, а также подобрать именно те решения, которые будут оптимальны с точки зрения OPEX.
Инженерные системы ЦОДа должны обеспечивать работоспособность развивающейся вычислительной инфраструктуры. Где находятся те «узкие места», которые чаще всего являются причиной проблем с инженерными подсистемами ЦОД?
Сергей Махлин: «Узким» местом может быть любая часть решения инженерной инфраструктуры, начиная с постановки задачи и проектирования и заканчивая эксплуатацией, сервисом и ремонтами. Максимально снизить вероятность возникновения проблем можно за счет обращения к надежным, проверенным компаниям. И, конечно, без лишней скромности можем сказать, что три собственных коммерческих Data-центра КРОК, построенных нами по нашим же проектам и имеющих наработку в среднем по десять лет, на данный момент не имеют ни одной секунды простоя (тьфу-тьфу-тьфу!). Два из этих Data-центров сертифицированы Uptime Institute на уровень Tier III.
История индустрии ЦОД – это история борьбы с отведением тепла и за минимизацию энергопотребления. Часто ли берете на вооружение новые разработки? Есть в копилке КРОК проекты с использованием альтернативной энергетики?
Сергей Махлин: На самом деле так называемые новые технологии по охлаждению ЦОД – это преимущественно давно известные решения, применяющиеся в других отраслях и в какой-то момент перешедшие в ЦОДостроение. Инженерный подход позволяет понимать сильные и слабые стороны каждой такой технологии и применять их в обоснованных случаях наряду с так называемыми «классическими» схемами. Если говорить о конкретных примерах, то мы использовали и ветрогенераторы для нужд базовых станций одного из сотовых операторов в России, и солнечную электростанцию в проекте зарубежного заказчика.
Вы согласны, что переход к гибридной инфраструктуре – это ключевой тренд развития всей индустрии корпоративных ЦОДов, как об этом говорят глобальные эксперты? Сложен ли такой переход?
Александр Сысоев: В последнее время клиенты проявляют интерес к гибридной ИТ-инфраструктуре. Эта модель помогает решать различные задачи: от снятия пиковых нагрузок в «горячий сезон» до отделения сред разработки и тестирования от основного функционала. Если у вас есть хорошо работающая локальная вычислительная инфраструктура, которая обеспечивает в штатном режиме все потребности компании, подключение дополнительных облачных ресурсов помогает переваривать время от времени возникающие сверхнагрузки. Например, в период сдачи отчетности, когда бухгалтерия тысячи раз в день обращается к базе и загружает локальные сервера. Отдельное же размещение в облаке сред тестирования или разработки дает гибкость и адаптивность, необходимую для оперативного выпуска новых решений. И то, и другое востребовано сейчас на рынке, и тенденция будет нарастать. Думаю, тут не стоит культивировать опасения, связанные с безопасностью, ведь зачастую в облаке SLA даже намного жестче, чем внутри компании. А по поводу сложности перехода на гибридную инфраструктуру могу сказать, что при правильном планировании и тщательном проектировании миграции проблем, как правило, не возникает.
Ключевые достоинства облачной модели предоставления ИТ-услуг: измеримость, SLA, плата за реальное пользование и т.д.,- вендоры инфраструктуры стараются перенести даже в локальную ИТ-инфраструктуру, например, в виде услуги «хранение как сервис» (STorage As-A-Service). По Вашим оценкам, в каких направлениях вычислительной инфраструктуры ЦОД следует ожидать наибольших достижений в плане экономичности использования ресурсов?
Александр Сысоев: Хочу начать с того, что любое сокращение затрат не должно осуществляться в ущерб надежности и качества предоставляемого сервиса. В основе должны быть целесообразность и поиск решения конкретных бизнес-задач. Если смотреть с этой точки зрения, кому-то экономию дает, например, отказ от серверов класса хай-энд и построение той же вычислительной системы на новом поколении серверов х86. У кого-то сократить расходы позволяет переход с RICS-архитектуры на ту же x86. А кто-то в ходе проектирования выясняет, что для его задач достаточно mid-range СХД, и вовсе не обязательно переплачивать за более дорогостоящие решения. Ведь современные mid-range-системы выполняют тот же функционал, что и hi-end три года назад.
И, конечно, нельзя забывать, что экономию ресурсов дает передача эксплуатации ИТ-инфраструктуры на аутсорсинг. Такой подход – оценка реальных потребностей – дает не только уменьшение бюджета на закупку вычислительных мощностей, но и сокращает в дальнейшем затраты на обслуживание.
Предполагаю, что в силу разных обстоятельств, вынуждающих экономить, четче обозначится тенденция разумного потребления ИТ-ресурсов. И основными направлениями развития здесь станет максимально широкое использование универсальных гиперконвергентных платформ, ведь размещение на сервере и вычислительной части, и хранения позволяет существенно экономить на закупках СХД.
Кроме этого, мы заметим уход от hi-end класса в сторону более простых, но продвинутых решений, использующих для управления программную инфраструктуру. Более активно будет внедряться программное обеспечение с открытым исходным кодом (для хранения данных, построения сети, виртуализации)
Применительно к различным аспектам вычислительной инфраструктуры ЦОД сегодня часто применяют слово «эластичный». С вашей точки зрения, какие сферы вычислительной инфраструктуры ЦОД сегодня способны стать «эластичными», и каким образом это сказывается на технических и экономических показателях функционирования ЦОД?
Александр Сысоев: В первую очередь, я бы говорил о построении отказоустойчивых геораспределенных кластеров. Специальное программное обеспечение позволяет растягивать вычислительные ресурсы между площадками, настраивать репликацию между ними. Это способствует минимизации простоев и повышению уровня защиты данных. При такой архитектуре заказчики фактически не замечают инцидентов: когда из строя выходит система хранения данных на одной площадке, то сервер обращается к данным на второй. Стрейч-кластеры позволяют избегать даунтайма, который был бы неизбежен в другой ситуации, и, соответственно, финансовых потерь от простоев бизнеса. А они, как известно, могу быть очень велики.
С ростом объемов вторичных данных актуальным становится также эластичная система хранения для архивов. Она позволяет распределять данные на несколько площадок, после чего они равномерно распределяются по всем доступным хранилищам. Обращение от пользователя при этом будет направляться на ближайшее к нему хранилище, что ускоряет выполнение запроса.
Информационные системы клиентов становятся все сложнее, все сильнее интегрируются друг с другом. Что поможет упростить администрирование вычислительной и инженерной инфраструктурой ЦОД?
Сергей Махлин: По нашему опыту, действительно хорошо спроектированная и построенная инженерная инфраструктура ЦОД практически не требует сложного администрирования. Реакция систем на сбои в необходимой степени автоматизирована, а главное - предсказуема. Разумеется, периодические ТО и плановые ремонты выполняются людьми, и потому четко отстроенные регламенты и процедуры помогают не допускать ошибок, связанных с человеческим фактором. Гениальнейший принцип проектирования - K.I.S.S. (Keep It Simple, Stupid), сформулированный в середине прошлого века инженерами авиации и означающий, что любая система работает тем стабильнее, чем она проще, - в полной мере применим и к инженерной инфраструктуре ЦОД.
Александр Сысоев: Если говорить о вычислительных системах ЦОД, то вначале, безусловно, необходимо провести комплексный аудит. Он позволяет получить сведения о состоянии информационных систем и их инфраструктурной части, быстро выявить и исправить очевидные ошибки.
На следующем этапе следует обеспечить масштабируемость ИТ-инфраструктуры, в первую очередь, за счет гибридных схем и получения дополнительных ресурсов по модели IaaS. Часто деградация рабочих параметров системы возникает при возрастании нагрузок (например, резкий рост запросов к интернет-магазину в период скидок), поэтому продуманный подход к масштабируемости системы – залог ее стабильной работы.
Клиентам мы всегда рекомендует вести непрерывный ИТ-аудит. Технологические изменения порождают перераспределение нагрузки на ИТ-инфраструктуру. Простой пример: объединение нескольких серверов баз данных в один отказоустойчивый кластер. Для того чтобы сделать это, нужно быть уверенным, что ИТ-системы справляются с нагрузкой. Нужно точно знать, как в результате изменений поменяется нагрузка на дисковую подсистему, подсистему сети, сопутствующие компоненты. Это позволит своевременно выявлять «бутылочные горлышки», которые будут ограничивать производительность информационных систем и бизнес-приложений.
Наконец, важно чтобы команды постоянно взаимодействовали. Разработчики должны уметь действовать в связке со службой эксплуатации ИТ-инфраструктуры и со службой внедрения (связка Agile и DevOps). И все они вместе — с подразделениями, отвечающими за информационную безопасность и, конечно, с бизнес-заказчиками. Это позволяет сокращать сроки разработки и вовремя выявлять неисправности.
На уровне прикладного ПО все более популярным становится принцип low-code, который дает возможность участвовать в доработке прикладных систем бизнес-пользователям. Есть что-то подобное в сфере управления ИТ?
Александр Сысоев: Есть очень похожий на low-code принцип для ИТ – IaC (Infrastructure-as-Code), буквально «Управление ИТ-инфраструктурой как код». Он позволяет гораздо быстрее закрывать потребность в ресурсах у разработчиков за счет автоматизации процессов. Администраторы при таком подходе освобождаются от рутинных операций по выделению виртуальных машин/контейнеров и их конфигурированию. То же самое с внесением изменений в уже выделенную инфраструктуру.
Есть и другие подходы, позволяющие упростить управление вычислительными системами: шаблонизация и автоматизация, переход на сервисную модель предоставления ресурсов, построение гибридной облачной модели ИТ и т.д. Применение таких подходов вместе и по отдельности позволяет сильно упростить управление постоянно растущей и меняющийся инфраструктурой.
В любом корпоративном ЦОДе работает все больше информационных систем, которые используют все больше данных из разных источников. Системы обработки этих данных объективно становятся сложнее. Объективно стоимость информационных систем и ИТ-поддержки, включая постоянную модернизацию, постоянно повышается. Где стоит искать резервы для экономии?
Александр Сысоев: Главная рекомендация – строить информационные системы не просто под текущую задачу, а с учетом будущих нагрузок. Я бы сказал, что, проектируя систему, надо представлять, где вы окажетесь хотя бы через три года. За это время, конечно же, вырастет количество задач, и производительность систем должна быть готова к увеличению нагрузки в 1,5-2 раза, вырастет объем данных, а вместе с ним потребуется расширение емкости СХД. Надо постараться все это предусмотреть заранее. И ни в коем случае не ориентироваться исключительно на стоимость оборудования, ведь дешево – не всегда в перспективе означает экономию. Гораздо важнее ваши задачи, потребности бизнес-заказчиков.
Кроме этого, я бы обратил внимание на организацию рационального хранения данных. Если информация не востребована каждый день, но хранить ее по каким-то причинам надо (требования регуляторов, в целях последующей аналитики и проч.), ее стоит переводить на менее дорогостоящие носители. Учет всех этих нюансов позволит избежать серьезных проблем, гибко перераспределяя вычислительные мощности и сокращая затраты на их обслуживание.