Baum AI

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Baum Inform (Баум-Информ)
Технологии: Big Data,  Data Mining

Основные статьи:

Как работают российские AI-решения для разных отраслей. Обзор комплекса BAUM AI

Любой информационный след, который оставляет оборудование, человек или система, можно фиксировать и сохранять. Эта информация представляет ценность, т.к. чаще всего искусственный интеллект обучается на исторических данных. Чем длиннее «хвост» данных, тем больше точность ИИ при решении задач. Компания «Баум-Информ» разработала программно-технический комплекс BAUM AI, который может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика.

Комплекс BAUM AI может стать основой для быстрых вычислений и инструментом для решения сложных задач заказчика

Что собой представляет BAUM AI

Это симбиоз систем хранения данных, вычислительных процессоров Nvidia (в планах — совместимость с процессорами «Модуль» и IVA) и софта собственной разработки. Комплекс позволяет создавать, обучать или использовать предобученные модели искусственного интеллекта без необходимости прямого кодирования по принципу drag n drop. BAUM AI оснащен интуитивно-понятным графическим интерфейсов (GUI).

Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании Крок:

«
Особенность решения в том, что его аппаратная часть может размещаться на ИТ-оборудовании российского производства. А это значит, что программно-аппаратный комплекс будет полностью удовлетворять требованиям регуляторов в области импортозамещения электроники, и его можно использовать в ходе модернизации инфраструктуры как отечественный продукт. По кодам классификации решение полностью закрывает потребности как в аппаратной части из реестра Минпромторга, так и в программном обеспечении из реестра Минцифры.
»

Какие задачи решает BAUM AI

Многие крупные корпоративные заказчики работают с двумя источниками данных — открытыми и закрытыми. К первым относится информация из интернета, полученная с помощью краулинга и парсинга. Например, научные публикации, патентная система, корпоративные сайты компаний и т.д. Закрытые данные находятся внутри доверенного периметра (корпоративная переписка, архивные чертежи, технологические карты и т.д.).

Благодаря BAUM AI заказчик может в пару кликов обратиться к данным и собрать свою модель искусственного интеллекта, провести ее обучение, верификацию и тестирование. Контроль версионности MLops поможет в навигации по моделям или в их доработке. Сбор блок-схем моделей и процессов происходит в нотации BPMN 2.0.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Должен констатировать, что технологии искусственного интеллекта уже стали обыденностью. Они позволяют анализировать любые типы данных, помогая принимать решения даже в ситуации неопределенности. Их применяют в бизнес-процессах любой сложности и любого уровня: от проектирования и производства до логистики и продвижения. Запросы на решения различных задач поступают от моторостроителей и металлургов до патентоведов и архивистов.
»

Как BAUM AI помогает промышленным предприятиям

На предприятиях теплосетей, чтобы исключить внеплановую остановку в случае подозрения на неисправность оборудования (турбин, компрессоров, генераторов, котлов и др), нужна система мониторинга. Она предоставляет предиктивную аналитику для точной оценки фактического и прогнозируемого состояния оборудования. Это необходимо, чтобы минимизировать издержки и возможные риски. Ведь, согласно исследованиям, час простоя в промышленном производстве может стоить предприятию в среднем $100 тысяч.

Система предиктивной аналитики на базе комплекса BAUM AI позволяет выполнять интеллектуальный мониторинг, сравнивать фактические показатели оборудования с математической цифровой или эталонной моделью, находить аномалии и определять вероятность выхода из строя.

Разработка системы включает в себя общение со специалистами, создание многомерной модели базы данных (логи оборудования, информация о плановых и внеплановых работах, выходе из строя и т.д.), формирование математических и цифровых эталонных моделей работы оборудования. Затем идет разработка модуля интеллектуальной обработки данных и моделей предиктивной аналитики, настройка протоколов обмена данными между всеми единицами системы.

Все модели упаковываются в блок-схемы BPMN 2.0, для пользователей настраиваются динамические Dashboard (рабочие пространства). Профильные инженеры получают доступ к логам оборудования, они могут использовать готовые модели машинного обучения и прогнозировать внештатные ситуации, принимать взвешенные решения при внеплановых остановках.

Помощь научно-производственным компаниям

Крупные научно-производственные предприятия должны быть в курсе последних трендов, знать новые перспективные материалы. Также необходимо хранить архивные документы, чертежи, технологические карты, корпоративную переписку. В этом случае компаниям требуется база знаний, которая включает в себя структурированные и неструктурированные данные из открытых и закрытых источников.

All-in-one решение BAUM AI помогает обрабатывать большие данные. Комплекс устанавливается на территории заказчика. Решение интегрируется с корпоративной поисковой системой elasticsearch, чтобы после запроса к базе знаний пользователь сразу получал доступ к продвинутой аналитике.

Как реализуется проект: готовятся модели машинного обучения и обучаются нейронные сети для определения устойчивых научных кластеров, трендов, лидеров исследований, вероятностей получения патентов, окупаемости изобретения, анализа источников информации и авторов, сравнения текущих технологических процессов и вновь создаваемых и т.д.

Как итог: пользователи BAUM AI могут работать в трех плоскостях — интеллектуальная научная «разведка», продвинутая аналитика данных, решение узкоспециализированных задач, связанных с подбором и анализом материалов и их актуальности.

Помощь телекому

Производители систем хранения данных часто сталкиваются с поломкой дисков. Нужно решение, которое на ранней стадии спрогнозирует выход из строя или критическое состояние элементов системы.

BAUM AI способна определять сценарии, которые предшествуют выходу из строя, а также прогнозировать ключевые параметры. При этом могут быть сформированы рекомендации по профилактическим работам.

Для начала специалисты «Баум-Информ» вместе с инженерами формируют перечень анализируемых данных. Затем организуют дополнительный учет планового и внепланового обслуживания с созданием временных меток для каждого события.

Учет всех показателей системы хранения у заказчика ведется в PostgreSQL. «Баум-Информ» разрабатывает и настраивает буферную зону, получающую основной пакет анализируемых показателей.

Логика работы системы предиктивной аналитики выглядит следующим образом:

  • Данные из Zabbix (public.history_log) отправляются в модуль подкачки данных. В последнем хранится необходимое количество данных для работоспособности моделей ИИ. Данные разделяются на кластеры (Hardware, Configuration, Capacity, Performance).
  • Информация отправляется в модуль обработки входных данных. Она проходит нормализацию и стандартизацию (при необходимости).
  • Модуль содержит сохраненные натренированные модели. Все они были созданы с использованием блок-схем BPMN 2.0, по принципу drag n drop. В предиктиве участвуют обученные авторегрессионные модели, рекуррентные и свёрточные нейронные сети.
  • Нормализованные данные проходят через натренированные модели (в соответствии с кластерами).
  • В случае срабатывания какого-либо сценария создается подпись, отправляется в статистику, и запускается сценарий (замена диска, рекомендация обновления и т.д).

При работе с GUI пользователь видит основную информацию о работе предиктивной системы:

  • Статистика отображает количество отработанных часов, сработавших сценариев, новых подписей и т.д. (можно подобрать наиболее важные параметры).
  • Текущее состояние дублирует основные показатели с Zabbix в части анализируемых атрибутов.
  • Прогноз отражает необходимость замены оборудования, риск выхода из строя элементов, рекомендации по установке обновления

В результате система функционирует в штатном режиме, как отдельно приложение к общей системе мониторинга СХД. Благодаря искусственному интеллекту, инженеры могут на ранней стадии приступить к минимизации рисков ущерба или выхода из строя оборудования, а также своевременно выполнить работы, связанные с безопасностью системы в целом.

Помощь финтеху

Крупные платежные системы сталкиваются с трудностями в определении мошеннических операций в транзакциях. Решение — применение модели машинного обучения, позволяющей с высокой точностью находить мошеннические транзакции.

«Баум-Информ» использует подход, связанный с созданием новых синтетических агрегированных признаков. Они позволяют увидеть мошеннические операции в гипертрофированном виде.

Специалисты компании находят главные признаки, которые характеризуют мошеннические операции, и подбирают алгоритмы машинного обучения. При разработке учитывается как обучение с учителем, когда алгоритму показывают, какие операции являются мошенническими, так и обучение без учителя, когда алгоритм обучается, не зная, как выглядят мошеннические транзакции.

В BAUM AI размещается датасет, разворачивается кластер, настраиваются spark-сессии, позволяющие выполнять распределенные вычисления. Данные проходят нормализацию, выполняется интеллектуальное заполнение пропущенных значений в транзакциях.

Для создания моделей разрабатываются блок-схемы BPMN 2.0. Далее они drag n drop методом помещаются в конструктор ИИ, обучаются, потом снимаются метрики. Совместно с представителями заказчика проводится валидация и A/B тестирование обученных моделей.

В итоге модель обеспечивает точность до 98% при определении мошеннических операций.

Андрей Гантимуров, CTO (Chief technology officer) «Баум-Информ»:

«
Мы очень прагматично смотрим на применение искусственного интеллекта в любой области. Прежде чем приступить к реализации проекта, нужно обсудить все детали, включая ожидания заказчика, чтобы понять, действительно ли для решения бизнес-задач нужен искусственный интеллект. Далее следует выдвинуть гипотезу и договориться о том, как ее проверять, и уже потом проектировать решение. И еще важно подчеркнуть: я бы не рекомендовал планировать применение конкретных концепций на перспективу более одного-двух лет. Технологии развиваются очень быстро, и быть всегда в тренде позволяет только agile-подход.
»


Наталия Софронова, руководитель направления импортозамещения оборудования ИТ-компании КРОК:

«
На внедрение полноценного решения потребуется от полугода до года, в ряде случаев чуть больше. Все, безусловно, зависит от задач, которые сильно сказываются на объемах работы. Если говорить поэтапно, то на проверку гипотезы, как правило требуется от пары недель до месяца, на разработку пилота и запуск минимально жизнеспособного продукта (MVP) - от трех месяцев до полугода.
»



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  БизнесАвтоматика НПЦ (118)
  Инфосистемы Джет (13)
  Marketing Logic (Маркетинг Лоджик) (9)
  Сбербанк (8)
  Другие (574)

  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  IPavlov (Айпавлов) (2)
  NLogic (2)
  Сапиенс солюшнс (Sapiens solutions) (2)
  Другие (48)

  БизнесАвтоматика НПЦ (13)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Яндекс (Yandex) (2)
  Московский центр инновационных технологий в здравоохранении (2)
  Другие (58)

  БизнесАвтоматика НПЦ (7)
  Департамент информационных технологий Москвы (ДИТ) (3)
  Яндекс.Облако (Yandex.Cloud) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  Другие (58)

  БизнесАвтоматика НПЦ (3)
  Мобильные ТелеСистемы (МТС) (2)
  Университет Иннополис (2)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Максимум, Maximum (ГБУ МО ЦРЦТ - Центр развития цифровых технологий) (1)
  Другие (18)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
  БизнесАвтоматика НПЦ (2, 117)
  Oracle (12, 14)
  IBM (10, 14)
  Полиматика (Polymatica) (3, 10)
  Другие (284, 143)

  БизнесАвтоматика НПЦ (1, 3)
  Полиматика (Polymatica) (1, 2)
  Dell EMC (1, 2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 1)
  Napoleon IT (Наполеон Айти) (1, 1)
  Другие (5, 5)

  БизнесАвтоматика НПЦ (1, 13)
  Сбербанк (2, 2)
  Платформа больших данных (Platforma) (1, 2)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (1, 2)
  К-Скай (K-SkAI) (1, 2)
  Другие (14, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Сбербанк (2, 2)
  Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Другие (12, 12)

  БизнесАвтоматика НПЦ (1, 2)
  Exodrive (Экзодрайв) (1, 1)
  T1 Digital (Т1 Диджитал) (1, 1)
  Мобильные ТелеСистемы (МТС) (1, 1)
  Т1 Консалтинг (Т1 Инновации) (1, 1)
  Другие (2, 2)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Deductor - 226 (226, 0)
  Visary BI Платформа бизнес-аналитики - 117 (117, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 25 (0, 25)
  Loginom Аналитическая платформа - 10 (10, 0)
  Polymatica Analytics Аналитическая платформа - 10 (10, 0)
  Другие 108

  Visary BI Платформа бизнес-аналитики - 3 (3, 0)
  EMC Greenplum Data Computing Appliance - 2 (2, 0)
  Polymatica Analytics Аналитическая платформа - 2 (2, 0)
  ЦРТ: Speech Analytics Lab - 1 (1, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Другие 3

  Visary BI Платформа бизнес-аналитики - 13 (13, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 4 (0, 4)
  Loginom Аналитическая платформа - 2 (2, 0)
  Platforma и HFLabs: Технология безопасного метчинга данных - 2 (2, 0)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  Другие 4

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  CM.Expert Data Mining платформа - 2 (2, 0)
  ЦРТ: Speech Analytics Lab - 2 (2, 0)
  PIX Process Management (PIX Процессы) - 1 (1, 0)
  Другие 7

  Visary BI Платформа бизнес-аналитики - 2 (2, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Сфера. Интеллектуальный анализ процессов - 1 (1, 0)
  МТС DataOps Platform - 1 (1, 0)
  Другие -1

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (118)
  Большая Тройка (46)
  Умная Логистика (14)
  Доверенная среда (13)
  Инфосистемы Джет (11)
  Другие (417)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  БизнесАвтоматика НПЦ (3)
  Ростелеком (3)
  Другие (54)

  БизнесАвтоматика НПЦ (13)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс (Yandex) (2)
  Mains Lab (Мэйнс Лаборатория) (2)
  Другие (45)

  БизнесАвтоматика НПЦ (7)
  Департамент информационных технологий Москвы (ДИТ) (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (61)

  БизнесАвтоматика НПЦ (3)
  Университет Иннополис (2)
  Синара-Транспортные Машины (СТМ) (1)
  Axenix (ранее Аксенчер Россия) Аксеникс (1)
  Синимекс (Cinimex) (1)
  Другие (21)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 117)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Доверенная среда (1, 13)
  РИР (Росатом Инфраструктурные решения) (3, 8)
  Другие (246, 109)

  Доверенная среда (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 13)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Нетрика Медицина (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  CM.Expert (АвтоЭксперт) (1, 2)
  Датакаталог (1, 2)
  Цифра (1, 2)
  Другие (12, 12)

  БизнесАвтоматика НПЦ (1, 2)
  Exodrive (Экзодрайв) (1, 1)
  Softline (Софтлайн) (1, 1)
  Датакаталог (1, 1)
  РИР (Росатом Инфраструктурные решения) (1, 1)
  Другие (6, 6)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 117 (117, 0)
  Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 19 (0, 19)
  Доверенная среда: Триафлай BI-платформа - 13 (13, 0)
  Росатом Цифровое ресурсоснабжение - 8 (3, 5)
  Другие 79

  Доверенная среда: Триафлай BI-платформа - 5 (5, 0)
  ZIIoT Платформа для работы с промышленными данными - 4 (4, 0)
  Visary BI Платформа бизнес-аналитики - 3 (3, 0)
  Большая Тройка: АИС Редактор территориальных схем - 2 (2, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  Другие 7

  Visary BI Платформа бизнес-аналитики - 13 (13, 0)
  Росатом Цифровое ресурсоснабжение - 3 (1, 2)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  СберАналитика - 1 (1, 0)
  МТС: Цифровой водоканал - 1 (1, 0)
  Другие 1

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Росатом Цифровое ресурсоснабжение - 4 (1, 3)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Arenadata Catalog - 2 (2, 0)
  Другие 5

  Visary BI Платформа бизнес-аналитики - 2 (2, 0)
  Наносемантика NLab Marker - 1 (1, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Softline Digital: RozniTech Платформа для сетевого ритейла (ранее Retailix.Ai) - 1 (1, 0)
  ZIIoT Платформа для работы с промышленными данными - 1 (1, 0)
  Другие 1