DIS Group: Селена Lakehouse-платформа

Продукт
Разработчики: DIS Group - ДИС Групп - Дата Интегрейшн Софтвер - Data Integration Software
Дата премьеры системы: 2025/07/07
Технологии: Big Data,  Data Mining

Основные статьи:

2025: Представление платформы «Селена»

Компания DIS Group 7 июля 2025 года представила платформу данных Селена — российское решение класса Data Lakehouse, предназначенное для высокоскоростной обработки и анализа больших объемов структурированных и неструктурированных данных. Платформа позволяет обрабатывать запросы в 10 раз быстрее аналогов благодаря использованию векторных вычислений и MPP-архитектуры.

Платформа Селена сочетает в себе преимущества традиционных [[хранилище данных|хранилищ данных]] и Data Lakehouse, обеспечивая большую скорость аналитической обработки информации. Благодаря использованию технологий векторных вычислений и массово-параллельной архитектуры (MPP), система демонстрирует десятикратное превосходство в скорости выполнения запросов по сравнению с аналогичными предложениями на рынке.

Платформа предназначена для обработки как небольших, так и экстремально больших объемов информации, включая хранение и анализ информации свыше 100 петабайт. Архитектурное решение позволяет развертывать систему как в облачной инфраструктуре, так и в рамках локальных дата-центров, что обеспечивает гибкость при внедрении в различных отраслях.

Особое внимание разработчики уделили совместимости с современными стандартами хранения данных. Платформа поддерживает работу с любыми объектными хранилищами, совместимыми с S3-протоколом, включая популярные решения MinIO и Ceph, а также отечественную платформу «Закрома». Наряду с этим сохраняется возможность интеграции с распределенной файловой системой HDFS, что позволяет использовать Селену в уже существующих Hadoop-инфраструктурах.

В основе платформы лежит высокопроизводительный движок StarRocks, который обеспечивает стабильную работу даже при экстремальных нагрузках. Система демонстрирует особую эффективность при выполнении сложных аналитических запросов в условиях высокой конкуренции за вычислительные ресурсы. Это делает решение особенно востребованным в таких сферах, как финансовая аналитика, промышленный интернет вещей (IIoT), телекоммуникации и государственный сектор.

Для обеспечения максимальной скорости доступа к данным в Селене реализована комбинация технологий обработки информации. Колоночная организация хранения данных в сочетании с многоуровневой системой кэширования (включая кэширование запросов, промежуточных результатов и готовых отчетов) позволяет минимизировать время отклика системы. Дополнительное ускорение достигается за счет использования cost-based оптимизатора запросов, материализованных представлений и специализированных агрегационных таблиц.

Интеграция искусственного интеллекта посредством реализации MCP-сервера позволяет пользователям формулировать запросы к базе данных на естественном языке, автоматизировать создание блокнотов и взаимодействовать с хранилищем в формате чата.

Селена совместима с популярными BI-инструментами и аналитическими платформами. В 2025 году планируется начать процесс сертификации платформы в ФСТЭК России, что откроет новые возможности для внедрения решения в государственных структурах и организациях с повышенными требованиями к информационной безопасности.

Разработчиком одноименной платформы является российская компания «Платформа данных Селена», созданная в 2024
году. Мастер-дистрибьютором продукта Селена является компания DIS Group.

«
Современный рынок больших данных требует решений, способных обеспечивать аналитику в реальном времени на постоянно растущих объемах информации. Селена создавалась именно как ответ на этот вызов. Мы не просто увеличили скорость обработки данных, но и обеспечили необходимую гибкость развертывания, что особенно важно для крупных предприятий с распределенной инфраструктурой,
сказал Дмитрий Замула, технический директор Селена.
»

«

Data Lakehouse — логичное развитие Data Lake и традиционных хранилищ: с одной стороны, сохраняется способность обрабатывать большие объемы разнородных данных, с другой — добавляется высокая скорость, благодаря улучшенной работе с метаданными и индексацией. Это кардинально повышает эффективность работы аналитиков и дата-сайентистов. Интеграция искусственного интеллекта в Data Lakehouse обеспечивает удобный доступ к данным и возможность взаимодействия с ними на естественном языке. Все это сделает Data Lakehouse стандартом для аналитики в ближайшем будущем. На российском рынке практически нет решений по контролю качества данных, способных полноценно работать с Lakehouse. DIS Group и Селена — среди первых, кто решает эту проблему,

отметил Олег Гиацинтов, технический директор DIS Group.
»



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (128)
  БизнесАвтоматика НПЦ (123)
  Инфосистемы Джет (13)
  Сбербанк (12)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (11)
  Другие (777)

  БизнесАвтоматика НПЦ (4)
  Napoleon IT (Наполеон Айти) (2)
  PIX Robotics (Пикс Роботикс) (2)
  Инфосистемы Джет (2)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  SL Soft (СЛ Софт) (3)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Синимекс (Cinimex) (2)
  Другие (67)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (4)
  Loginom Company (Аналитические технологии) (3)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Другие (94)

  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (2)
  Napoleon IT (Наполеон Айти) (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Институт искусственного интеллекта (ИИИ) МФТИ (1)
  Лаборатория измерительных систем (1)
  Другие (16)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (2, 240)
  БизнесАвтоматика НПЦ (2, 122)
  Полиматика (Polymatica) (4, 15)
  SL Soft (СЛ Софт) (4, 15)
  Oracle (12, 14)
  Другие (423, 213)

  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (3, 3)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  PIX Robotics (Пикс Роботикс) (1, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  Другие (17, 20)

  БизнесАвтоматика НПЦ (1, 5)
  SL Soft (СЛ Софт) (3, 4)
  Полиматика (Polymatica) (3, 4)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Rubbles (Раблз) (1, 2)
  Другие (16, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Loginom Company (Аналитические технологии) (1, 4)
  Neirolis (Нейролис) (1, 1)
  Rubbles (Раблз) (1, 1)
  VolgaBlob (ВолгаБлоб) (1, 1)
  Другие (13, 13)

  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (1, 2)
  НКЦ ОТИС Лаборатория исследований и разработок (IPChain Lab) (1, 1)
  CleverDATA (Клевер Дата) (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Deductor - 226 (226, 0)
  Visary BI Платформа бизнес-аналитики - 122 (122, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 53 (0, 53)
  Loginom - 14 (14, 0)
  Polymatica Analytics Аналитическая платформа - 14 (13, 1)
  Другие 97

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 6 (0, 6)
  Visary BI Платформа бизнес-аналитики - 4 (4, 0)
  ЦРТ: Speech Analytics Lab - 2 (2, 0)
  Polymatica Analytics Аналитическая платформа - 2 (2, 0)
  PIX Process Management (PIX Процессы) - 2 (2, 0)
  Другие 6

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 10 (0, 10)
  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Polymatica Analytics Аналитическая платформа - 3 (2, 1)
  МТС DataOps Platform - 1 (1, 0)
  Сфера. Интеллектуальный анализ процессов - 1 (1, 0)
  Другие -10

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 8 (0, 8)
  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Loginom - 4 (4, 0)
  T-Data Аналитическая платформа - 1 (1, 0)
  ITMan Discovery - 1 (1, 0)
  Другие -3

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  ЦРТ: SpeechXplore ИИ-решение для исследования и развития коммуникаций с клиентами - 1 (1, 0)
  CleverData CDP - 1 (1, 0)
  Другие -2

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (123)
  Большая Тройка (46)
  Сбербанк (16)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (625)

  БизнесАвтоматика НПЦ (4)
  РИР (Росатом Инфраструктурные решения) (3)
  Сбер Бизнес Софт (2)
  Marketing Logic (Маркетинг Лоджик) (2)
  Инфосистемы Джет (2)
  Другие (62)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  Наносемантика (Nanosemantics Lab) (2)
  Сбербанк (2)
  Синимекс (Cinimex) (2)
  Другие (75)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (6)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Цифра (2)
  Другие (93)

  Лаборатория измерительных систем (1)
  НКЦ ОТИС Лаборатория исследований и разработок (IPChain Lab) (1)
  ОБИТ (1)
  Ростелеком Центр (ЦентрТелеком) Макрорегиональный филиал (1)
  Северсталь Диджитал (Severstal Digital) (1)
  Другие (15)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (3, 122)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 14)
  Цифра (2, 12)
  Другие (326, 172)

  РИР (Росатом Инфраструктурные решения) (3, 4)
  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Другие (18, 20)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  DataCatalog (ДатаКаталог) (1, 3)
  Luxms (1, 3)
  Ростелеком (1, 2)
  Другие (19, 22)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (2, 2)
  Data Sapience (Дата Сапиенс) (1, 2)
  Цифра (1, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Другие (11, 12)

  НКЦ ОТИС Лаборатория исследований и разработок (IPChain Lab) (1, 1)
  CleverDATA (Клевер Дата) (1, 1)
  Триафлай (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 122 (122, 0)
  Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 37 (0, 37)
  Триафлай BI-платформа - 14 (14, 0)
  ZIIoT Платформа для работы с промышленными данными - 12 (12, 0)
  Другие 95

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 4 (0, 4)
  Росатом Цифровое ресурсоснабжение - 4 (1, 3)
  Visary BI Платформа бизнес-аналитики - 4 (4, 0)
  Arenadata Catalog - 2 (2, 0)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Другие 6

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 7 (0, 7)
  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Arenadata Catalog - 3 (3, 0)
  Luxms BI - 3 (3, 0)
  RT.Datalake Решение для хранения и обработки данных любых объемов - 2 (2, 0)
  Другие 3

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 6 (0, 6)
  Росатом Цифровое ресурсоснабжение - 2 (1, 1)
  Arenadata Catalog - 2 (2, 0)
  Data Ocean Nova Платформа данных - 2 (2, 0)
  Другие 0

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Триафлай BI-платформа - 1 (1, 0)
  Другие -1