«Умный мониторинг»: система сбора и анализа данных, оперативного реагирования и прогнозирования инцидентов
Современные ИТ переживают экспоненциальный рост. Несколько лет назад инфраструктура усредненного заказчика включала несколько серверных стоек. Сегодня средний показатель — несколько тысяч единиц различных узлов, единиц оборудования, серверов и виртуальных машин. В таких условиях администраторам приходится мониторить структуры из тысяч конфигурационных единиц. Изменяются и требования к инструментам, которые применяются для мониторинга — они должны поддерживать возможность отслеживания тысяч объектов инфраструктуры.
Содержание |
Рынок средств мониторинга достаточно широк, но далеко не все продукты, которые на нем представлены, пригодны для мониторинга крупных инфраструктур. Среди решений, способных справиться с задачей отслеживания происходящего на обширных ИТ-ландшафтах, выделяется «Умный мониторинг», разработка компании «ИТ-Экспертиза». Так как «Умный мониторинг» — российское решение, включенное в Реестр отечественного программного обеспечения (№ 13278, категория «Средства мониторинга и управления»), это позволяет заказчикам обеспечить свою независимость от санкционных действий иностранных вендоров. «Умный мониторинг» может использоваться и предприятиями, управляющими объектами критической информационной инфраструктуры.
Актуальность систем мониторинга с расширенными возможностями и глубокой автоматизацией диктуется и ситуацией на кадровом рынке. Нехватка ИТ-специалистов формирует интерес заказчиков к инструментам, которые способны не только отслеживать состояние инфраструктур, но и принимать решения без участия человека, а кроме того, подключать к процессу управления инфраструктурой другие программные средства.
«Умный мониторинг»
В компании «ИТ-Экспертиза» реализуют в решении новый подход к мониторингу информационных инфраструктур. Этот процесс рассматривается не как контроль набора метрик, а как анализ показателей и характеристик, свойственных объекту с его правилами и связями с другими объектами. При этом, контроль и изменение этих правил позволяет полноценно управлять объектом, а не только предсказывать возможные инциденты.
Компания основывается на собственных компетенциях в области сопровождения информационных решений, в первую очередь на платформе 1С — «ИТ-Экспертиза» обеспечивает поддержку информационных систем около 700 организаций. Исходя из опыта работы с ними и был разработан специализированный продукт, предназначенный для мониторинга инфраструктур. При этом компания не стала сосредотачиваться на создании решения, которое дублирует возможности других систем, а предложила рынку систему, обладающую расширенной функциональностью и позволяющей автоматизировать множество задач, связанных с управлением инфраструктурой.
Аудитория решения
Условно, аудиторию «Умного мониторинга» можно определить как компании, которые стремятся заменить используемые ими простые системы мониторинга, подобные Zabbix или 1С, на другие решения, обладающие широкой функциональностью и способные автоматизировать решение большого числа задач, связанных с управлением информационной инфраструктурой.
«Умный мониторинг» ориентируется на средних и крупных заказчиков, инфраструктура которых насчитывает несколько тысяч объектов — программных или аппаратных единиц; в их число входят физические сервера, рабочие станции, виртуальные машины, информационные системы и базы данных.
При этом «Умный мониторинг» позволяет отслеживать работу не только «традиционных» элементов инфраструктуры, но и вспомогательного оборудования, такого как камеры видео-наблюдения. Условием, обеспечивающим возможность мониторинга, является наличие отклика, который единица оборудования «отдает» в инфраструктуру. В качестве примера такого мониторинга в компании «ИТ-Экспертиза» приводят мониторинг корпоративной ERP-системы, который позволяет отслеживать не только потребляемые ею в момент времени или в динамике вычислительные ресурсы, но и логику работы программного обеспечения: количество проведенных транзакций, введенных записей базы данных и т.п. Кроме того, отслеживаются такие показатели, как доступность системы или соответствие ее работы нормам SLA.
Какие задачи решает «Умный мониторинг»
Прежде всего, «Умный мониторинг» позволяет оптимизировать расходы, связанные с содержанием инфраструктуры. Это достигается за счет частичной автоматизации выполняемых операций, расчета автоматических метрик и глубинного анализа поступающих данных.
Еще одно преимущество решения — существенное сокращение времени реагирования на инциденты. При этом, ряд необходимых действий в таких случаях решение может выполнить самостоятельно; в остальных случаях оно немедленно уведомляет о происшествии службу технической поддержки.
С помощью «Умного мониторинга» можно прогнозировать события в информационной инфраструктуре. В решении используются механизмы AI/ML, которые позволяют проводить предиктивный анализ событий и формировать прогнозы происшествий для их превентивного предотвращения.
Принцип работы решения и AIOps
Решение подразумевает установку агентов «Умного мониторинга» на оборудование, которое находится в инфраструктуре заказчика. Они анализируют конфигурацию оборудования и установленного ПО, и осуществляют мониторинг их работы в режиме реального времени. Данные, полученные агентами, передаются на сервер «Умного мониторинга», где они обрабатываются, анализируются и затем отображаются в интерфейсе системы.
При этом данные о состоянии инфраструктуры «Умный мониторинг» может получать как от собственных агентов, так и от сторонних систем мониторинга, находящихся в контуре наблюдаемой инфраструктуры (например, Zabbix). Кроме того, решение может интегрироваться с внешними системами — инфраструктурными, CMDB, сетевыми сервисами, Service Desk и т.п.
«Умный мониторинг» анализирует весь комплекс данных, характеризующих состояние инфраструктуры: аппаратные (CPU, RAM, SSD и др.), программные (счетчики, логи операционных систем и прикладного ПО), данные бизнес-приложений (данные технологического журнала, данные результатов регистраций).
На их основе решение регистрирует инциденты, находит способы их решения, формирует расчетные показатели и прогнозы, а также отчеты по сопровождению их систем.
Отличительная черта «Умного мониторинга» — использование подхода AIOps, который подразумевает использование искусственного интеллекта и машинного обучения для автоматизации управления информационной инфраструктурой. Благодаря AIOps «Умный мониторинг» в режиме, близком к реальному времени, позволяет анализировать текущее состояние инфраструктуры, сравнивать показатели с накопленным массивом данных и выдавать прогнозы о возможных инцидентах в работе ИТ-систем предприятия. Это позволяет заказчикам отказаться от выполнения многочисленных рутинных операций, связанных с анализом показателей, менеджментом систем и расчетом возможных инцидентов.
Механизмы AI, которые используются в «Умном мониторинге», базируются на массиве исторических данных, накопленных системой в рамках работы в инфраструктуре конкретного предприятия. При этом анализируются только те данные, которые касаются инфраструктуры конкретного заказчика — они не передаются за пределы периметра компании и недоступны вендору или другим заказчикам. Иными словами — никуда наружу, в облака, либо сторонние хранилища, данные не отправляются. Такая сепарация объясняется тем, что исторические данные о работе инфраструктур имеют для заказчиков критическое значение и не могут быть использованы в интересах сторонних организаций.
Одна из функциональностей «Умного мониторинга» — Auto Healing, система автоматической обратной связи. Она позволяет при определении аномальных явлений в инфраструктуре запустить программу немедленного реагирования на инциденты: собрать логи систем, запустить системы защиты, восстановить данные из бэкапов, подключить резервные каналы связи, провести мягкую перезагрузку системы и т.п. Таким образом, Auto Healing позволяет применять «Умный мониторинг» компаниям, которые исповедуют при управлении своими ИТ-системами подход «невидимого сервиса», когда восстановление работоспособности отдельных систем и инфраструктуры в целом происходит автоматически, незаметно для пользователей, а действия администраторов, необходимые для устранения аварии, осуществляются максимально быстро и просто.
Особенности поставки
«Умный мониторинг» поставляется как on-premise решение. Отсутствие облачной версии решения разработчики объясняют тем, что подавляющее большинство заказчиков не готовы передавать свои данные в какие-то ни было облачные системы, в том числе, в собственные приватные. Причина — крайняя чувствительность данных, которые собираются системой и функциональность Auto Healing, требующая соблюдения жестких норм безопасности.
«Умный мониторинг» — решение, которое отличается простотой развертывания. Тем не менее, в компании «ИТ-Экспертиза» рекомендуют привлекать к осуществлению проектов внедрения системных интеграторов из числа партнерских компаний. Эта рекомендация связана с необходимостью соблюдения корпоративных политик заказчиков в области информационной безопасности, которые потребуют изменений и дополнений для обеспечения работы «Умного мониторинга».
Минимальных требований к инфраструктуре, отслеживание которой возможно проводить при помощи «Умного мониторинга», не существует. В его нынешнем виде продукт адресован компаниям, обладающим крупными инфраструктурами, которые насчитывают десятки физических серверов. При этом вендор планирует к концу 2024 года выпустить облегченную, базовую версию решения, которая будет предназначена для мониторинга небольших инфраструктур. Не исключается возможность бесплатного распространения этой версии.