D. lab: Решение для производства мультимедийного контента

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: D. lab
Технологии: Речевые технологии,  Системы видеоаналитики

Основные статьи:

2023: Начало тестирования нейропродакшена в проектах ГПМ Радио, Rutybe, Premier и Yappy

Студия нейропродашкена D. lab, которую «Газпром-Медиа Холдинг» запустил в сентябре 2023 года, представила первые демо-образцы AIGC – мультимедийного контента разных форматов и жанров, произведенные искусственным интеллектом с минимальным участием человека. Образцы созданы с помощью собственного решения D.lab. Теперь студия переходит к тестированию своих технологий на проектах Детского Радио, Rutube, PREMIER и Yappy. Об этом «Газпром-Медиа Холдинг» сообщил 15 ноября 2023 года.

Решение D.lab позволяет создавать новые форматы контента. Например, анимированные пересказы литературных произведений или краткие пересказы полнометражных фильмов. Решение может синтезировать музыкальное оформление и закадровый голос, визуализировать аудиоконтент, генерировать цифровых персонажей, стилизовать видео. Решение гибридное – в его основе более 20 open source и коммерческих моделей искусственного интеллекта, дополнительно обученных и скомбинированных командой D.lab, для производства мультимедийного контента. Также в решении применяются технологии компьютерного зрения, синтеза и распознавания речи.Вебинар: «Управление качеством в фарме: от зарубежных решений и бумаги — к российской системе Docs5 EQMS»

Ключевые плюсы решения D.lab – экономия времени профессионалов, повышение скорости выполнения рутинных задач и снижение затрат на производство. Например, вместо ручной отрисовки различных фонов, персонажей или деталей можно выбирать из предложенных нейросетями вариантов, созданных на основе специальных запросов-промптов. Участие человека требуется только при постановке задачи, внесении стилистических правок и контроле результатов.

«
Мы работаем в постоянном контакте с профессионалами медиа, поскольку наше решение в первую очередь для них. У нас не нейромосфильм и нейроголливуд. Их и не может быть. У нас – набор решений-помощников для профессионального продакшена. Этот набор уже на текущем этапе позволил втрое сократить стоимость отдельных производственных процессов и выполнять их за часы и дни, а не за месяцы и годы. У нас нейросети уже более чем на 80% участвуют в создании самого разнообразного контента новых форматов. И нет задачи, чтобы на 100% вкалывали роботы,
сказал Эдуард Маас, руководитель D.lab.
»

На RUTUBE-канале D.lab[1] представлены первые примеры AIGC-работ: анимационные пересказы «Слова о полку Игореве» и рассказа Айзека Азимова «Лжец!» из знаменитого цикла «Я, робот», видеопересказы киноклассики – «Метрополиса» Фрица Ланга и «Броненосца Потемкина» Сергея Эйзенштейна, а также образец анимационной стилизации видео.

Как работает решение D.lab:

В цикле создания анимационных пересказов литературных произведений от D.lab в среднем 7 этапов:

  • анализ исходного текста LLM-моделями
  • написание сценария LLM-моделями
  • формирование стилевой концепции моделями Text-to-Image
  • черновая раскадровка ролика с текстовым описанием LLM-моделями
  • генерация сцен и персонажей моделями Text-to-Image
  • добавление анимации (при необходимости с участием человека)
  • озвучание моделями Text-to-Speech

В «Лжеце!» качество нейросинтезированного озвучания не устроило команду D.lab, и было принято решение использовать классический вариант с настоящим человеческим голосом. На подготовку таких видеороликов по книгам сейчас уходит около двух недель.

В видеопересказах полнометражных фильмов решением D.lab выполнено 6 видов работ:

  • анализ фильма ансамблем нейросетей
  • обработка полученных результатов LLM-моделями
  • написание сценария видеоролика LLM-моделями
  • выделение ключевых монтажных точек ансамблем нейросетей
  • монтаж видеоролика
  • озвучание моделями Text-to-Speech

Решение D.lab по стилизации позволяет оперативно «переодевать» любое видео, например, превращать фильм в мультфильм. Решение двухшаговое:

  • текстовое описание стилистики моделями Text-to-Image
  • накладывание стилистики на исходное видео моделями Image-to-Image.

Демонстрация возможностей решения D.lab по стилизации

Как будут проходить тесты на Детском радио, в RUTUBE, PREMIER и Yappy:

Субхолдинг ГПМ Радио заинтересовали анимированные пересказы, и было принято решение протестировать нейропродакшен D.lab в визуализации контента единственной в России станции для юных слушателей – Детского радио. Уже готовится визуализация популярного аудиоподкаста.

Команда RUTUBE тестирует возможности решения D.lab в создании коротких видео из своих оригинальных шоу. Параллельно платформа анализирует возможности AIGC сразу в нескольких направлениях – интеграция в новые выпуски текущих проектов, разработка премьерных шоу, построенных на нейроконтенте, использование такого материала в трансляциях спортивных и культурных событий, визуализация аудиоконтента, перемонтирование контента в разные форматы.

Онлайн-кинотеатр PREMIER выбрал для тестирования стилизацию видео. Трейлер одного из топовых сериалов сервиса будет представлен в непривычном виде.

В Yappy также выбрали стилизацию как наиболее подходящий и оперативный инструмент для обработки текущего контента. Команда платформы хочет использовать решение D.lab для повышения качества исходного видео (свет, стабилизация, фокусировка и т. п.).

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  ВидеоМатрикс (Videomatrix) (48)
  VizorLabs (Визорлабс) (44)
  Вокорд (Vocord) (39)
  VisionLabs (ВижнЛабс) (29)
  Simetra (ранее А+С Транспроект) (19)
  Другие (437)

  VizorLabs (Визорлабс) (13)
  SteadyControl (6)
  Ростелеком (3)
  VisionLabs (ВижнЛабс) (3)
  Транс-Телематика (3)
  Другие (36)

  ВидеоМатрикс (Videomatrix) (11)
  SteadyControl (5)
  Сбер Бизнес Софт (4)
  Nord Clan (Норд Клан) (3)
  VizorLabs (Визорлабс) (3)
  Другие (31)

  Интеллектуальные технические системы НПО (НПО ИТС) (5)
  Северсталь-Инфоком (3)
  NtechLab (Нтех Лаб) (3)
  Softlogic (Софтлоджик) (2)
  VisionLabs (ВижнЛабс) (2)
  Другие (44)

  ВидеоМатрикс (Videomatrix) (2)
  Лаборатория измерительных систем (1)
  РИР (Росатом Инфраструктурные решения) (1)
  РТК Радиология (1)
  Северсталь Диджитал (Severstal Digital) (1)
  Другие (5)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  ВидеоМатрикс (Videomatrix) (21, 48)
  Вокорд (Vocord) (9, 45)
  VizorLabs (Визорлабс) (9, 43)
  VisionLabs (ВижнЛабс) (13, 36)
  PTV Group (2, 25)
  Другие (402, 270)

  VizorLabs (Визорлабс) (4, 13)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Технологии безопасности дорожного движения (ТБДД) (1, 3)
  ВидеоМатрикс (Videomatrix) (2, 2)
  Другие (15, 19)

  ВидеоМатрикс (Videomatrix) (5, 11)
  SteadyControl HoReCa (1, 5)
  SteadyControl (1, 5)
  Nord Clan (Норд Клан) (1, 3)
  VisionLabs (ВижнЛабс) (2, 2)
  Другие (12, 14)

  Интеллектуальные технические системы НПО (НПО ИТС) (1, 4)
  NtechLab (Нтех Лаб) (1, 3)
  Softlogic (Софтлоджик Рус) (1, 3)
  ВидеоМатрикс (Videomatrix) (2, 2)
  VisionLabs (ВижнЛабс) (1, 2)
  Другие (16, 17)

  ВидеоМатрикс (Videomatrix) (2, 2)
  Городские технологии (1, 1)
  РТК Радиология (1, 1)
  РИР (Росатом Инфраструктурные решения) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Vizorlabs Платформенное решение видеоаналитики - 38 (11, 27)
  VisionLabs Luna - 37 (27, 10)
  PTV Visum - 25 (25, 0)
  SteadyControl Система контроля и управления персоналом - 24 (24, 0)
  Vocord FaceControl - 18 (13, 5)
  Другие 248

  Vizorlabs Платформенное решение видеоаналитики - 11 (2, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  ТБДД: Азимут Комплексы фотовидеофиксации - 3 (3, 0)
  Nord Clan: ML Sense - 2 (2, 0)
  Русатом Интеллектуальная транспортная система - 2 (2, 0)
  Другие 8

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  Vmx SILA: TP - 5 (5, 0)
  Nord Clan: ML Sense - 3 (3, 0)
  Vmx SILA: LSI - 3 (3, 0)
  PTV Visum - 2 (2, 0)
  Другие 11

  НПО ИТС: Паук Трафик - 4 (4, 0)
  NtechLab FindFace Multi - 3 (3, 0)
  Softlogic: SC-iMVS-RM3 Автокомплекс нейросетевого наблюдения для контроля объектов дорожной инфраструктуры - 3 (3, 0)
  VisionLabs Luna - 2 (2, 0)
  Nord Clan: ML Sense - 2 (2, 0)
  Другие 15

  РТК Радиология: Digipax Единая радиологическая информационная система (ЕРИС) - 1 (0, 1)
  Городские технологии: Умные парковки - 1 (1, 0)
  Русатом Интеллектуальная транспортная система - 1 (1, 0)
  Vmx Dequs: PIS - 1 (1, 0)
  Другие -1

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (41)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (29)
  SteadyControl (19)
  Сбербанк (18)
  Другие (265)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Другие (28)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Проф ИТ (Prof IT) Ростов-на-Дону (3)
  Другие (39)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (8)
  Сбербанк (6)
  ОБИТ (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Другие (31)

  Сбербанк (3)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  ОБИТ (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 50)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (6, 42)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (13, 32)
  Сбербанк (24, 27)
  SteadyControl (1, 24)
  Другие (512, 308)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 6)
  Другие (18, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Другие (29, 47)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 8)
  Сбербанк (2, 8)
  СалютДевайсы (ранее SberDevices) (2, 8)
  Яндекс (Yandex) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4, 4)
  Другие (25, 32)

  СалютДевайсы (ранее SberDevices) (2, 4)
  Сбербанк (2, 4)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (1, 2)
  Т-Банк (1, 1)
  TargetAI (Таргет плюс) (1, 1)
  Другие (5, 5)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  МТС Exolve Голосовой робот - 31 (7, 24)
  SteadyControl Система контроля и управления персоналом - 24 (24, 0)
  Сбер: GigaChat (ГигаЧат) - 23 (20, 3)
  BSS Digital2Speech - 21 (21, 0)
  EXpress Защищенный корпоративный мессенджер - 16 (16, 0)
  Другие 220

  МТС Exolve Голосовой робот - 9 (0, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  BSS Digital2Speech - 5 (5, 0)
  SmartLogger II - 4 (4, 0)
  Другие 12

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  BSS Digital2Speech - 4 (4, 0)
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3 (3, 0)
  Napoleon IT отзывы - 3 (3, 0)
  Другие 36

  Сбер: GigaChat (ГигаЧат) - 8 (7, 1)
  МТС Exolve Виртуальная АТС - 6 (6, 0)
  YandexGPT - 4 (4, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  EXpress Защищенный корпоративный мессенджер - 3 (3, 0)
  Другие 25

  Сбер: GigaChat (ГигаЧат) - 4 (3, 1)
  Lad: GPTZator - 2 (2, 0)
  LazyDoc Программный комплекс для заполнения и анализа медицинской документации - 1 (1, 0)
  T-Bank VoiceKit - 1 (0, 1)
  Targetai Платформа-конструктор для создания, тестирования и мониторинга LLM-агентов - 1 (1, 0)
  Другие 0