2024/11/01 13:12:25

«Умный мониторинг»: система сбора и анализа данных, оперативного реагирования и прогнозирования инцидентов

Современные ИТ переживают экспоненциальный рост. Несколько лет назад инфраструктура усредненного заказчика включала несколько серверных стоек. Сегодня средний показатель — несколько тысяч единиц различных узлов, единиц оборудования, серверов и виртуальных машин. В таких условиях администраторам приходится мониторить структуры из тысяч конфигурационных единиц. Изменяются и требования к инструментам, которые применяются для мониторинга — они должны поддерживать возможность отслеживания тысяч объектов инфраструктуры.

Содержание

Рынок средств мониторинга достаточно широк, но далеко не все продукты, которые на нем представлены, пригодны для мониторинга крупных инфраструктур. Среди решений, способных справиться с задачей отслеживания происходящего на обширных ИТ-ландшафтах, выделяется «Умный мониторинг», разработка компании «ИТ-Экспертиза». Так как «Умный мониторинг» — российское решение, включенное в Реестр отечественного программного обеспечения (№ 13278, категория «Средства мониторинга и управления»), это позволяет заказчикам обеспечить свою независимость от санкционных действий иностранных вендоров. «Умный мониторинг» может использоваться и предприятиями, управляющими объектами критической информационной инфраструктуры.

Актуальность систем мониторинга с расширенными возможностями и глубокой автоматизацией диктуется и ситуацией на кадровом рынке. Нехватка ИТ-специалистов формирует интерес заказчиков к инструментам, которые способны не только отслеживать состояние инфраструктур, но и принимать решения без участия человека, а кроме того, подключать к процессу управления инфраструктурой другие программные средства.

«Умный мониторинг»

В компании «ИТ-Экспертиза» реализуют в решении новый подход к мониторингу информационных инфраструктур. Этот процесс рассматривается не как контроль набора метрик, а как анализ показателей и характеристик, свойственных объекту с его правилами и связями с другими объектами. При этом, контроль и изменение этих правил позволяет полноценно управлять объектом, а не только предсказывать возможные инциденты.

Компания основывается на собственных компетенциях в области сопровождения информационных решений, в первую очередь на платформе — «ИТ-Экспертиза» обеспечивает поддержку информационных систем около 700 организаций. Исходя из опыта работы с ними и был разработан специализированный продукт, предназначенный для мониторинга инфраструктур. При этом компания не стала сосредотачиваться на создании решения, которое дублирует возможности других систем, а предложила рынку систему, обладающую расширенной функциональностью и позволяющей автоматизировать множество задач, связанных с управлением инфраструктурой.

Аудитория решения

Условно, аудиторию «Умного мониторинга» можно определить как компании, которые стремятся заменить используемые ими простые системы мониторинга, подобные Zabbix или , на другие решения, обладающие широкой функциональностью и способные автоматизировать решение большого числа задач, связанных с управлением информационной инфраструктурой.

«Умный мониторинг» ориентируется на средних и крупных заказчиков, инфраструктура которых насчитывает несколько тысяч объектов — программных или аппаратных единиц; в их число входят физические сервера, рабочие станции, виртуальные машины, информационные системы и базы данных.

При этом «Умный мониторинг» позволяет отслеживать работу не только «традиционных» элементов инфраструктуры, но и вспомогательного оборудования, такого как камеры видео-наблюдения. Условием, обеспечивающим возможность мониторинга, является наличие отклика, который единица оборудования «отдает» в инфраструктуру. В качестве примера такого мониторинга в компании «ИТ-Экспертиза» приводят мониторинг корпоративной ERP-системы, который позволяет отслеживать не только потребляемые ею в момент времени или в динамике вычислительные ресурсы, но и логику работы программного обеспечения: количество проведенных транзакций, введенных записей базы данных и т.п. Кроме того, отслеживаются такие показатели, как доступность системы или соответствие ее работы нормам SLA.

Какие задачи решает «Умный мониторинг»

Прежде всего, «Умный мониторинг» позволяет оптимизировать расходы, связанные с содержанием инфраструктуры. Это достигается за счет частичной автоматизации выполняемых операций, расчета автоматических метрик и глубинного анализа поступающих данных.

Еще одно преимущество решения — существенное сокращение времени реагирования на инциденты. При этом, ряд необходимых действий в таких случаях решение может выполнить самостоятельно; в остальных случаях оно немедленно уведомляет о происшествии службу технической поддержки.

С помощью «Умного мониторинга» можно прогнозировать события в информационной инфраструктуре. В решении используются механизмы AI/ML, которые позволяют проводить предиктивный анализ событий и формировать прогнозы происшествий для их превентивного предотвращения.

Принцип работы решения и AIOps

Решение подразумевает установку агентов «Умного мониторинга» на оборудование, которое находится в инфраструктуре заказчика. Они анализируют конфигурацию оборудования и установленного ПО, и осуществляют мониторинг их работы в режиме реального времени. Данные, полученные агентами, передаются на сервер «Умного мониторинга», где они обрабатываются, анализируются и затем отображаются в интерфейсе системы.

При этом данные о состоянии инфраструктуры «Умный мониторинг» может получать как от собственных агентов, так и от сторонних систем мониторинга, находящихся в контуре наблюдаемой инфраструктуры (например, Zabbix). Кроме того, решение может интегрироваться с внешними системами — инфраструктурными, CMDB, сетевыми сервисами, Service Desk и т.п.

«Умный мониторинг» анализирует весь комплекс данных, характеризующих состояние инфраструктуры: аппаратные (CPU, RAM, SSD и др.), программные (счетчики, логи операционных систем и прикладного ПО), данные бизнес-приложений (данные технологического журнала, данные результатов регистраций).

На их основе решение регистрирует инциденты, находит способы их решения, формирует расчетные показатели и прогнозы, а также отчеты по сопровождению их систем.

Отличительная черта «Умного мониторинга» — использование подхода AIOps, который подразумевает использование искусственного интеллекта и машинного обучения для автоматизации управления информационной инфраструктурой. Благодаря AIOps «Умный мониторинг» в режиме, близком к реальному времени, позволяет анализировать текущее состояние инфраструктуры, сравнивать показатели с накопленным массивом данных и выдавать прогнозы о возможных инцидентах в работе ИТ-систем предприятия. Это позволяет заказчикам отказаться от выполнения многочисленных рутинных операций, связанных с анализом показателей, менеджментом систем и расчетом возможных инцидентов.

Механизмы AI, которые используются в «Умном мониторинге», базируются на массиве исторических данных, накопленных системой в рамках работы в инфраструктуре конкретного предприятия. При этом анализируются только те данные, которые касаются инфраструктуры конкретного заказчика — они не передаются за пределы периметра компании и недоступны вендору или другим заказчикам. Иными словами — никуда наружу, в облака, либо сторонние хранилища, данные не отправляются. Такая сепарация объясняется тем, что исторические данные о работе инфраструктур имеют для заказчиков критическое значение и не могут быть использованы в интересах сторонних организаций.

Одна из функциональностей «Умного мониторинга» — Auto Healing, система автоматической обратной связи. Она позволяет при определении аномальных явлений в инфраструктуре запустить программу немедленного реагирования на инциденты: собрать логи систем, запустить системы защиты, восстановить данные из бэкапов, подключить резервные каналы связи, провести мягкую перезагрузку системы и т.п. Таким образом, Auto Healing позволяет применять «Умный мониторинг» компаниям, которые исповедуют при управлении своими ИТ-системами подход «невидимого сервиса», когда восстановление работоспособности отдельных систем и инфраструктуры в целом происходит автоматически, незаметно для пользователей, а действия администраторов, необходимые для устранения аварии, осуществляются максимально быстро и просто.

Особенности поставки

«Умный мониторинг» поставляется как on-premise решение. Отсутствие облачной версии решения разработчики объясняют тем, что подавляющее большинство заказчиков не готовы передавать свои данные в какие-то ни было облачные системы, в том числе, в собственные приватные. Причина — крайняя чувствительность данных, которые собираются системой и функциональность Auto Healing, требующая соблюдения жестких норм безопасности.

«Умный мониторинг» — решение, которое отличается простотой развертывания. Тем не менее, в компании «ИТ-Экспертиза» рекомендуют привлекать к осуществлению проектов внедрения системных интеграторов из числа партнерских компаний. Эта рекомендация связана с необходимостью соблюдения корпоративных политик заказчиков в области информационной безопасности, которые потребуют изменений и дополнений для обеспечения работы «Умного мониторинга».

Минимальных требований к инфраструктуре, отслеживание которой возможно проводить при помощи «Умного мониторинга», не существует. В его нынешнем виде продукт адресован компаниям, обладающим крупными инфраструктурами, которые насчитывают десятки физических серверов. При этом вендор планирует к концу 2024 года выпустить облегченную, базовую версию решения, которая будет предназначена для мониторинга небольших инфраструктур. Не исключается возможность бесплатного распространения этой версии.