Самолет: Гибридная Data-платформа для управления данными

Продукт
Разработчики: Самолет Группа компаний
Дата премьеры системы: 2024/12/11
Технологии: Big Data,  MDM - Master Data Management - Управление основными мастер-данными

Основные статьи:

2024: Создание аналитической платформы

Группа компаний «Самолет» создала собственную аналитическую платформу, предназначенную для управления большими данными. Она сочетает достоинства классических корпоративных хранилищ с гибкостью озер данных и дает возможность обслуживать разнообразные запросы как к готовым витринам, так и работать с качественными очищенными данными в озере. Это существенно расширяет применение платформы в бизнесе и позволяет оптимизировать процессы загрузки, обработки, очистки и описания данных. Об этом ГК сообщила 11 декабря 2024 года.

В условиях, когда компания ежедневно обрабатывает значительные объемы разнородной информации, эффективное управление данными становится ключевым фактором успешного ведения бизнеса. «Самолет» использует data-driven подход при принятии стратегических и операционных решений, что позволяет компании повышать точность прогнозов, оптимизировать процессы и улучшать качество предоставляемых услуг.

Платформа «Самолета» — полноценное решение в области работы с большими данными, которое выстроено на стеке open source технологий и собственных разработках.

«
Для нас это был не просто проект, но и стратегический вызов. Многие компании предпочитают готовые проприетарные решения, но мы сделали выбор в пользу независимости и гибкости, что особенно важно в условиях динамично меняющейся ситуации на рынке. Наш подход позволил создать современную платформу с полным циклом обслуживания данных, которая реализует процессы data governance, в основе имеет инфраструктуру как код и соответствует самым высоким требованиям. Аналитическая платформа обеспечивает кроссистемную интеграцию данных более чем из 170 различных мастер-систем и источников. При этом следует отметить, что в ландшафт решения заложены различные инструменты, позволяющие не только накапливать данные, но и — что намного важнее — создавать стратегию управления данными и эффективно применять их в бизнесе. Например, в нашем ландшафте важную роль играет сервис нормативно-справочной информации, через который тиражируются единые корпоративные справочники, — рассказала директор по данным группы «Самолет» Ольга Свитнева.
»

Собственная разработка «Самолета» осуществляет систему контроля качества с многоуровневым механизмом валидации и очистки данных. Компания активно развивает и применяет на практике AI и проекты машинного обучения, поэтому в стеке есть компоненты, заточенные на обслуживание потребностей data science. Особое внимание в компании уделяют паттернам безопасной разработки и политикам доступа к данным с акцентом на то, чтобы превратить данные в управляемый актив — доступный, устойчивый и ликвидный.

Технологический стек платформы включает в себя множество разных компонентов и сервисов — Kubernetes, Kafka, Debezium, MiniO S3, ClickHouse, Airflow, PostgreSQL, DataHub, ML Flow, Jupiter Hub и прочие. Архитектура платформы спроектирована таким образом, чтобы создать максимальную отказоустойчивость и гибкость масштабирования в условиях высокой динамики роста объема данных в компании. Вся платформа развернута и работает на серверной инфраструктуре в собственном дата-центре группы «Самолет», что позволяет полностью соответствовать требованиям безопасности и производительности.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (272)
  Axelot (Акселот) (156)
  Цифра (31)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (25)
  АйТи Про (IT Pro) (21)
  Другие (287)

  Datareon (Датареон) (37)
  Axelot (Акселот) (25)
  Commvault (5)
  АйТи Про (IT Pro) (4)
  AnalyticsHub (АналитиксХаб) (2)
  Другие (35)

  Datareon (Датареон) (41)
  Axelot (Акселот) (32)
  Цифра (7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5)
  Софрос (Sofros) (4)
  Другие (22)

  Datareon (Датареон) (32)
  Axelot (Акселот) (19)
  Софрос (Sofros) (9)
  Naumen (Наумен консалтинг) (3)
  TData (ТДата) (3)
  Другие (32)

  Datareon (Датареон) (19)
  Axelot (Акселот) (8)
  Первый Бит (3)
  Софрос (Sofros) (3)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (3)
  Другие (20)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (2, 419)
  Цифра (2, 36)
  Axelot (Акселот) (1, 30)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5, 26)
  Informatica (14, 21)
  Другие (307, 261)

  Datareon (Датареон) (1, 60)
  Commvault (2, 5)
  АйТи Про (IT Pro) (1, 4)
  ЮниДата (UniData) (1, 3)
  Alation (1, 2)
  Другие (25, 25)

  Datareon (Датареон) (1, 71)
  Цифра (1, 7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3, 5)
  Axelot (Акселот) (1, 5)
  TData (ТДата) (2, 2)
  Другие (16, 18)

  Datareon (Датареон) (1, 57)
  Axelot (Акселот) (1, 6)
  Цифра (1, 4)
  Ростелеком (3, 3)
  TData (ТДата) (3, 3)
  Другие (18, 22)

  Datareon (Датареон) (1, 31)
  TData (ТДата) (2, 3)
  Ростелеком (2, 3)
  Data Sapience (Дата Сапиенс) (2, 3)
  Axelot (Акселот) (1, 2)
  Другие (15, 16)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon Platform - 419 (419, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 36 (36, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 30 (30, 0)
  HFLabs Единый клиент - 23 (23, 0)
  АйТи Про: BI.Qube - 18 (18, 0)
  Другие 211

  Datareon Platform - 60 (60, 0)
  АйТи Про: BI.Qube - 4 (4, 0)
  Commvault Complete Data Protection - 4 (4, 0)
  ЮниДата Платформа управления данными - 3 (3, 0)
  Alation Data Catalog - 2 (2, 0)
  Другие 26

  Datareon Platform - 71 (71, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 7 (7, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 5 (5, 0)
  Ростелеком Платформа управления данными - 2 (0, 2)
  HFLabs Центр управления согласиями (ЦУС) - 2 (2, 0)
  Другие 15

  Datareon Platform - 57 (57, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 6 (6, 0)
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 4 (4, 0)
  Naumen Enterprise Search - 3 (3, 0)
  Юниверс Платформа для управления данными - 2 (0, 2)
  Другие 13

  Datareon Platform - 31 (31, 0)
  Ростелеком Платформа управления данными - 3 (0, 3)
  HFLabs Единый клиент - 2 (2, 0)
  Data Sapience: Data Ocean Платформа управления данными - 2 (2, 0)
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 2 (2, 0)
  Другие 11

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (120)
  Большая Тройка (46)
  Сбербанк (14)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (482)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Другие (54)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Московский центр инновационных технологий в здравоохранении (2)
  Сбербанк (2)
  Другие (44)

  БизнесАвтоматика НПЦ (5)
  РИР (Росатом Инфраструктурные решения) (3)
  Сбер Бизнес Софт (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Инфосистемы Джет (2)
  Другие (65)

  БизнесАвтоматика НПЦ (8)
  Сбер Бизнес Софт (3)
  Авантелеком (2)
  Сбербанк (2)
  Синимекс (Cinimex) (2)
  Другие (74)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 119)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 13)
  Сбербанк (10, 10)
  Другие (255, 130)

  Триафлай (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 12)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Сбербанк (1, 1)
  Другие (7, 7)

  БизнесАвтоматика НПЦ (1, 5)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  Сбербанк (2, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Цифра (1, 2)
  Другие (15, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Сбербанк (3, 3)
  Цифра (1, 2)
  Retail Rocket (Ритейл Рокет) (1, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Другие (16, 17)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 119 (119, 0)
  Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 26 (0, 26)
  Триафлай BI-платформа - 13 (13, 0)
  ZIIoT Платформа для работы с промышленными данными - 10 (10, 0)
  Другие 81

  Триафлай BI-платформа - 5 (5, 0)
  ZIIoT Платформа для работы с промышленными данными - 4 (4, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  Visary BI Платформа бизнес-аналитики - 3 (3, 0)
  Большая Тройка: АСУ Управление отходами - 2 (2, 0)
  Другие 6

  Visary BI Платформа бизнес-аналитики - 12 (12, 0)
  Росатом Цифровое ресурсоснабжение - 3 (1, 2)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  N3.Аналитика - 1 (1, 0)
  RT.Datalake Решение для хранения и обработки данных любых объемов - 1 (1, 0)
  Другие 2

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 5 (0, 5)
  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Росатом Цифровое ресурсоснабжение - 4 (1, 3)
  Arenadata Catalog - 2 (2, 0)
  CM.Expert Data Mining платформа - 2 (2, 0)
  Другие 2

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 6 (0, 6)
  Arenadata Catalog - 2 (2, 0)
  Luxms BI - 2 (2, 0)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Другие 2