Название базовой системы (платформы): | Искусственный интеллект (ИИ, Artificial intelligence, AI) |
Разработчики: | Baum Inform (Баум-Информ) |
Технологии: | Big Data, Data Mining |
Основные статьи:
- Data mining Интеллектуальный анализ данных
- Большие данные (Big Data)
- Машинное обучение (Machine Learning)
Как работают российские AI-решения для разных отраслей. Обзор комплекса BAUM AI
Любой информационный след, который оставляет оборудование, человек или система, можно фиксировать и сохранять. Эта информация представляет ценность, т.к. чаще всего искусственный интеллект обучается на исторических данных. Чем длиннее «хвост» данных, тем больше точность ИИ при решении задач. Компания «Баум-Информ» разработала программно-технический комплекс BAUM AI, который может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика.
Что собой представляет BAUM AI
Это симбиоз систем хранения данных, вычислительных процессоров Nvidia (в планах — совместимость с процессорами «Модуль» и IVA) и софта собственной разработки. Комплекс позволяет создавать, обучать или использовать предобученные модели искусственного интеллекта без необходимости прямого кодирования по принципу drag n drop. BAUM AI оснащен интуитивно-понятным графическим интерфейсов (GUI).
Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании Крок:
Особенность решения в том, что его аппаратная часть может размещаться на ИТ-оборудовании российского производства. А это значит, что программно-аппаратный комплекс будет полностью удовлетворять требованиям регуляторов в области импортозамещения электроники, и его можно использовать в ходе модернизации инфраструктуры как отечественный продукт. По кодам классификации решение полностью закрывает потребности как в аппаратной части из реестра Минпромторга, так и в программном обеспечении из реестра Минцифры. |
Какие задачи решает BAUM AI
Многие крупные корпоративные заказчики работают с двумя источниками данных — открытыми и закрытыми. К первым относится информация из интернета, полученная с помощью краулинга и парсинга. Например, научные публикации, патентная система, корпоративные сайты компаний и т.д. Закрытые данные находятся внутри доверенного периметра (корпоративная переписка, архивные чертежи, технологические карты и т.д.).
Благодаря BAUM AI заказчик может в пару кликов обратиться к данным и собрать свою модель искусственного интеллекта, провести ее обучение, верификацию и тестирование. Контроль версионности MLops поможет в навигации по моделям или в их доработке. Сбор блок-схем моделей и процессов происходит в нотации BPMN 2.0.
Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:
Должен констатировать, что технологии искусственного интеллекта уже стали обыденностью. Они позволяют анализировать любые типы данных, помогая принимать решения даже в ситуации неопределенности. Их применяют в бизнес-процессах любой сложности и любого уровня: от проектирования и производства до логистики и продвижения. Запросы на решения различных задач поступают от моторостроителей и металлургов до патентоведов и архивистов. |
Как BAUM AI помогает промышленным предприятиям
На предприятиях теплосетей, чтобы исключить внеплановую остановку в случае подозрения на неисправность оборудования (турбин, компрессоров, генераторов, котлов и др), нужна система мониторинга. Она предоставляет предиктивную аналитику для точной оценки фактического и прогнозируемого состояния оборудования. Это необходимо, чтобы минимизировать издержки и возможные риски. Ведь, согласно исследованиям, час простоя в промышленном производстве может стоить предприятию в среднем $100 тысяч.
Система предиктивной аналитики на базе комплекса BAUM AI позволяет выполнять интеллектуальный мониторинг, сравнивать фактические показатели оборудования с математической цифровой или эталонной моделью, находить аномалии и определять вероятность выхода из строя.
Разработка системы включает в себя общение со специалистами, создание многомерной модели базы данных (логи оборудования, информация о плановых и внеплановых работах, выходе из строя и т.д.), формирование математических и цифровых эталонных моделей работы оборудования. Затем идет разработка модуля интеллектуальной обработки данных и моделей предиктивной аналитики, настройка протоколов обмена данными между всеми единицами системы.
Все модели упаковываются в блок-схемы BPMN 2.0, для пользователей настраиваются динамические Dashboard (рабочие пространства). Профильные инженеры получают доступ к логам оборудования, они могут использовать готовые модели машинного обучения и прогнозировать внештатные ситуации, принимать взвешенные решения при внеплановых остановках.
Помощь научно-производственным компаниям
Крупные научно-производственные предприятия должны быть в курсе последних трендов, знать новые перспективные материалы. Также необходимо хранить архивные документы, чертежи, технологические карты, корпоративную переписку. В этом случае компаниям требуется база знаний, которая включает в себя структурированные и неструктурированные данные из открытых и закрытых источников.
All-in-one решение BAUM AI помогает обрабатывать большие данные. Комплекс устанавливается на территории заказчика. Решение интегрируется с корпоративной поисковой системой elasticsearch, чтобы после запроса к базе знаний пользователь сразу получал доступ к продвинутой аналитике.
Как реализуется проект: готовятся модели машинного обучения и обучаются нейронные сети для определения устойчивых научных кластеров, трендов, лидеров исследований, вероятностей получения патентов, окупаемости изобретения, анализа источников информации и авторов, сравнения текущих технологических процессов и вновь создаваемых и т.д.
Как итог: пользователи BAUM AI могут работать в трех плоскостях — интеллектуальная научная «разведка», продвинутая аналитика данных, решение узкоспециализированных задач, связанных с подбором и анализом материалов и их актуальности.
Помощь телекому
Производители систем хранения данных часто сталкиваются с поломкой дисков. Нужно решение, которое на ранней стадии спрогнозирует выход из строя или критическое состояние элементов системы.
BAUM AI способна определять сценарии, которые предшествуют выходу из строя, а также прогнозировать ключевые параметры. При этом могут быть сформированы рекомендации по профилактическим работам.
Для начала специалисты «Баум-Информ» вместе с инженерами формируют перечень анализируемых данных. Затем организуют дополнительный учет планового и внепланового обслуживания с созданием временных меток для каждого события.
Учет всех показателей системы хранения у заказчика ведется в PostgreSQL. «Баум-Информ» разрабатывает и настраивает буферную зону, получающую основной пакет анализируемых показателей.
Логика работы системы предиктивной аналитики выглядит следующим образом:
- Данные из Zabbix (public.history_log) отправляются в модуль подкачки данных. В последнем хранится необходимое количество данных для работоспособности моделей ИИ. Данные разделяются на кластеры (Hardware, Configuration, Capacity, Performance).
- Информация отправляется в модуль обработки входных данных. Она проходит нормализацию и стандартизацию (при необходимости).
- Модуль содержит сохраненные натренированные модели. Все они были созданы с использованием блок-схем BPMN 2.0, по принципу drag n drop. В предиктиве участвуют обученные авторегрессионные модели, рекуррентные и свёрточные нейронные сети.
- Нормализованные данные проходят через натренированные модели (в соответствии с кластерами).
- В случае срабатывания какого-либо сценария создается подпись, отправляется в статистику, и запускается сценарий (замена диска, рекомендация обновления и т.д).
При работе с GUI пользователь видит основную информацию о работе предиктивной системы:
- Статистика отображает количество отработанных часов, сработавших сценариев, новых подписей и т.д. (можно подобрать наиболее важные параметры).
- Текущее состояние дублирует основные показатели с Zabbix в части анализируемых атрибутов.
- Прогноз отражает необходимость замены оборудования, риск выхода из строя элементов, рекомендации по установке обновления
В результате система функционирует в штатном режиме, как отдельно приложение к общей системе мониторинга СХД. Благодаря искусственному интеллекту, инженеры могут на ранней стадии приступить к минимизации рисков ущерба или выхода из строя оборудования, а также своевременно выполнить работы, связанные с безопасностью системы в целом.
Помощь финтеху
Крупные платежные системы сталкиваются с трудностями в определении мошеннических операций в транзакциях. Решение — применение модели машинного обучения, позволяющей с высокой точностью находить мошеннические транзакции.
«Баум-Информ» использует подход, связанный с созданием новых синтетических агрегированных признаков. Они позволяют увидеть мошеннические операции в гипертрофированном виде.
Специалисты компании находят главные признаки, которые характеризуют мошеннические операции, и подбирают алгоритмы машинного обучения. При разработке учитывается как обучение с учителем, когда алгоритму показывают, какие операции являются мошенническими, так и обучение без учителя, когда алгоритм обучается, не зная, как выглядят мошеннические транзакции.
В BAUM AI размещается датасет, разворачивается кластер, настраиваются spark-сессии, позволяющие выполнять распределенные вычисления. Данные проходят нормализацию, выполняется интеллектуальное заполнение пропущенных значений в транзакциях.
Для создания моделей разрабатываются блок-схемы BPMN 2.0. Далее они drag n drop методом помещаются в конструктор ИИ, обучаются, потом снимаются метрики. Совместно с представителями заказчика проводится валидация и A/B тестирование обученных моделей.
В итоге модель обеспечивает точность до 98% при определении мошеннических операций.
Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:
Мы очень прагматично смотрим на применение искусственного интеллекта в любой области. Прежде чем приступить к реализации проекта, нужно обсудить все детали, включая ожидания заказчика, чтобы понять, действительно ли для решения бизнес-задач нужен искусственный интеллект. Далее следует выдвинуть гипотезу и договориться о том, как ее проверять, и уже потом проектировать решение. И еще важно подчеркнуть: я бы не рекомендовал планировать применение конкретных концепций на перспективу более одного-двух лет. Технологии развиваются очень быстро, и быть всегда в тренде позволяет только agile-подход. |
Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании КРОК:
На внедрение полноценного решения потребуется от полугода до года, в ряде случаев чуть больше. Все, безусловно, зависит от задач, которые сильно сказываются на объемах работы. Если говорить поэтапно, то на проверку гипотезы, как правило требуется от пары недель до месяца, на разработку пилота и запуск минимально жизнеспособного продукта (MVP) - от трех месяцев до полугода. |
Подрядчики-лидеры по количеству проектов
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
БизнесАвтоматика НПЦ (120)
Инфосистемы Джет (13)
Сбербанк (10)
Полиматика (Polymatica) (9)
Другие (640)
БизнесАвтоматика НПЦ (3)
Ростелеком (3)
Сапиенс солюшнс (Sapiens solutions) (2)
Сбербанк (2)
IPavlov (Айпавлов) (2)
Другие (48)
БизнесАвтоматика НПЦ (12)
OneFactor (Уанфактор) ЕдиныйФактор (3)
Платформа больших данных (Platforma) (2)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
К-Скай (K-SkAI) (2)
Другие (57)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
БизнесАвтоматика НПЦ (2, 119)
Полиматика (Polymatica) (4, 15)
SL Soft (СЛ Софт) (3, 15)
Oracle (12, 14)
Другие (314, 182)
БизнесАвтоматика НПЦ (1, 3)
Dell EMC (1, 2)
Полиматика (Polymatica) (1, 2)
SL Soft (СЛ Софт) (1, 2)
Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
Другие (6, 6)
БизнесАвтоматика НПЦ (1, 12)
Сбербанк (2, 2)
Платформа больших данных (Platforma) (1, 2)
HFLabs (ХФ Лабс), ранее HumanFactorLabs (1, 2)
К-Скай (K-SkAI) (1, 2)
Другие (14, 16)
БизнесАвтоматика НПЦ (1, 5)
Сбербанк (3, 3)
Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
Полиматика (Polymatica) (1, 2)
Другие (16, 19)
БизнесАвтоматика НПЦ (1, 7)
Полиматика (Polymatica) (3, 4)
SL Soft (СЛ Софт) (3, 4)
Rubbles (Раблз) (1, 2)
Retail Rocket (Ритейл Рокет) (1, 2)
Другие (15, 15)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
Deductor - 226 (226, 0)
Visary BI Платформа бизнес-аналитики - 119 (119, 0)
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 37 (0, 37)
Polymatica Analytics Аналитическая платформа - 14 (13, 1)
IBM SPSS Decision Management - 10 (10, 0)
Другие 99
Visary BI Платформа бизнес-аналитики - 3 (3, 0)
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
EMC Greenplum Data Computing Appliance - 2 (2, 0)
Polymatica Analytics Аналитическая платформа - 2 (2, 0)
Loginom Аналитическая платформа - 1 (1, 0)
Другие 1
Visary BI Платформа бизнес-аналитики - 12 (12, 0)
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 5 (0, 5)
Platforma и HFLabs: Технология безопасного метчинга данных - 2 (2, 0)
Loginom Аналитическая платформа - 2 (2, 0)
PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
Другие 2
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 5 (0, 5)
Visary BI Платформа бизнес-аналитики - 5 (5, 0)
CM.Expert Data Mining платформа - 2 (2, 0)
Polymatica Analytics Аналитическая платформа - 2 (2, 0)
ЦРТ: Speech Analytics Lab - 2 (2, 0)
Другие 6
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 8 (0, 8)
Visary BI Платформа бизнес-аналитики - 7 (7, 0)
Polymatica Analytics Аналитическая платформа - 3 (2, 1)
Систематика: Optimining (ранее СвойРМ) - 1 (1, 0)
Сфера. Интеллектуальный анализ процессов - 1 (1, 0)
Другие -7
Подрядчики-лидеры по количеству проектов
БизнесАвтоматика НПЦ (120)
Большая Тройка (46)
Умная Логистика (14)
Сбербанк (14)
Доверенная среда (13)
Другие (482)
Доверенная среда (5)
Большая Тройка (4)
Цифра (4)
Ростелеком (3)
БизнесАвтоматика НПЦ (3)
Другие (54)
БизнесАвтоматика НПЦ (12)
OneFactor (Уанфактор) ЕдиныйФактор (3)
РИР (Росатом Инфраструктурные решения) (3)
Сбербанк (2)
Яндекс (Yandex) (2)
Другие (44)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
БизнесАвтоматика НПЦ (2, 119)
Большая Тройка (2, 46)
Умная Логистика (2, 14)
Триафлай (1, 13)
Сбербанк (10, 10)
Другие (255, 138)
Триафлай (1, 5)
Большая Тройка (2, 4)
Цифра (1, 4)
БизнесАвтоматика НПЦ (1, 3)
Умная Логистика (2, 2)
Другие (6, 8)
БизнесАвтоматика НПЦ (1, 12)
РИР (Росатом Инфраструктурные решения) (2, 3)
Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
МегаФон (2, 1)
Сбербанк (1, 1)
Другие (7, 7)
БизнесАвтоматика НПЦ (1, 5)
РИР (Росатом Инфраструктурные решения) (3, 4)
Сбербанк (2, 2)
CM.Expert (АвтоЭксперт) (1, 2)
Цифра (1, 2)
Другие (17, 18)
БизнесАвтоматика НПЦ (1, 7)
Сбербанк (3, 3)
Ростелеком (1, 2)
Цифра (1, 2)
Retail Rocket (Ритейл Рокет) (1, 2)
Другие (18, 21)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
Visary BI Платформа бизнес-аналитики - 119 (119, 0)
Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 26 (0, 26)
Триафлай BI-платформа - 13 (13, 0)
ZIIoT Платформа для работы с промышленными данными - 10 (10, 0)
Другие 85
Триафлай BI-платформа - 5 (5, 0)
ZIIoT Платформа для работы с промышленными данными - 4 (4, 0)
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
Visary BI Платформа бизнес-аналитики - 3 (3, 0)
Большая Тройка: АСУ Управление отходами - 2 (2, 0)
Другие 6
Visary BI Платформа бизнес-аналитики - 12 (12, 0)
Росатом Цифровое ресурсоснабжение - 3 (1, 2)
PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
N3.Аналитика - 1 (1, 0)
RT.Datalake Решение для хранения и обработки данных любых объемов - 1 (1, 0)
Другие 1
Visary BI Платформа бизнес-аналитики - 5 (5, 0)
Росатом Цифровое ресурсоснабжение - 4 (1, 3)
Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
Arenadata Catalog - 2 (2, 0)
CM.Expert Data Mining платформа - 2 (2, 0)
Другие 6