Сбер Kandinsky Video
Нейросеть для генерации полноценного видео

Продукт
Название базовой системы (платформы): Сбер Kandinsky Нейросеть для генерации изображений по описанию
Разработчики: Сбербанк
Дата премьеры системы: 2023/11/22
Технологии: Big Data

Содержание

Основные статьи:

2024: Постановка первого ИИ-балета

В июле 2024 года в Южно-Сахалинске состоялась премьера первого в России балета, созданного с применением технологий искусственного интеллекта (AI). Спектакль «Озаренность», повествующий об истории любви семьи инженеров, отправившихся на стройку века, стал уникальным проектом на стыке искусства и современных технологий.

Как сообщает «Коммерсантъ», AI-технологии «Сбера» были комплексно использованы при создании спектакля. Нейросеть GigaChat помогла уточнить сценарий и хореографию, Kandinsky сгенерировал эскизы декораций и костюмов, а SymFormer создал оригинальные музыкальные партии в стилистике современной классической музыки.

В Южно-Сахалинске состоялась премьера первого в России балета, созданного с применением технологий искусственного интеллекта

Автором идеи и режиссером выступил заслуженный артист России Кирилл Ермоленко. Он отметил, что решение раскрыть потенциал AI-технологий в творчестве было принято совместно с командой, и выразил уверенность в создании нового тренда в искусстве благодаря поддержке Сбера и уникальных специалистов.

В постановке приняли участие артисты Михайловского театра оперы и балета из Санкт-Петербурга и театра танца «Диалог» Сахалинской филармонии, впервые выступившие вместе на одной сцене. Композитором спектакля стал Руслан Сабиров, хореографом — Иван Зайцев, а художником-постановщиком — Мария Семакова.

Премьера AI-балета состоялась в рамках AI-трека проектно-образовательного интенсива «Архипелаг-2024». Проект является важной частью технологической трансформации Сахалинской области, начатой Сбером и регионом в 2023 году. В ходе трансформации планируется сконцентрировать AI-технологии на территории области, выделить площадки для апробации решений и раскрыть все факторы развития искусственного интеллекта, включая инфраструктуру, регулирование и кадры.

«
Синергия творчества людей и нейросетей даст зрителям возможность получить настоящее наслаждение от музыки и танца, — подчеркнул Андрей Незнамов, начальник Центра человекоцентричного AI Сбербанка.[1]
»

2023: Представление первой в России генеративной модели для создания видеороликов по тексту

Сбер представил нейросеть Kandinsky Video — первую в России генеративную модель для создания полноценных видеороликов по текстовому описанию. Об этом 22 ноября 2023 года TAdviser сообщили представители Сбера. По словам первого заместителя Председателя Правления Сбербанка Александра Ведяхина, модель генерирует видеоряд продолжительностью до восьми секунд с частотой 30 кадров в секунду.

Видео, сгенерированное нейросетью Kandinsky Video

Архитектура Kandinsky Video состоит из двух ключевых блоков: первый отвечает за создание ключевых кадров, из которых складывается структура сюжета видео, а второй — за генерацию интерполяционных кадров, которые позволяют достичь плавности движений в финальном видео. В основе двух блоков лежит обновленная модель синтеза изображений по текстовым описаниям Kandinsky 3.0.

Формат сгенерированного видео представляет собой непрерывную сцену с движением как объекта, так и фона. Именно это отличает видеоролики, синтезированные моделью Kandinsky Video, от анимационных видеороликов, в которых динамика достигается за счёт моделирования пролёта камеры относительно статичной сцены. Нейросеть создаёт видеоролики с разрешением 512 х 512 пикселей и различным соотношением сторон. Модель обучена на датасете из более чем 300 тыс. пар «текст — видео». Генерация видео занимает до трёх минут.

Видео, сгенерированное нейросетью Kandinsky Video

«
«Недавно мы обучили Kandinsky создавать анимационные видео по текстовому описанию, а уже сегодня представляем модель совершенно другого уровня — первую в России модель по генерации полноценных видеороликов по тексту. Это важный вклад в развитие российских генеративных нейросетей. У пользователей появится ещё больше возможностей для креатива и реализации своих творческих задумок любой направленности», — заявил Александр Ведяхин, первый заместитель Председателя Правления Сбербанка.
»

.

Как он добавил, люди смогут создавать уникальные видеоролики абсолютно бесплатно. А сама модель будет доступна в open source.

Видео, сгенерированное нейросетью Kandinsky Video

Ранее у активных пользователей Kandinsky 2.2 в тестовом режиме появилась возможность создания анимационных видеороликов. По одному запросу можно создать видео длиной в четыре секунды с выбранным эффектом анимации, с частотой 24 кадра в секунду и разрешением 640 х 640 пикселей. Пользователи нейросети Kandinsky 3.0 также могут создавать видеоролики по текстовому описанию в режиме анимации. Оценить возможности нейросети Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте[2], где можно оставить заявку на доступ.

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Примечания



СМ. ТАКЖЕ (4)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (120)
  Большая Тройка (46)
  Умная Логистика (14)
  Сбербанк (14)
  Доверенная среда (13)
  Другие (469)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Другие (54)

  БизнесАвтоматика НПЦ (12)
  РИР (Росатом Инфраструктурные решения) (3)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Сбербанк (2)
  Яндекс (Yandex) (2)
  Другие (44)

  БизнесАвтоматика НПЦ (5)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс.Облако (Yandex Cloud) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (63)

  БизнесАвтоматика НПЦ (8)
  Rocket Group (Рокет Групп) (2)
  Наносемантика (Nanosemantics Lab) (2)
  Сбер Бизнес Софт (2)
  Сбербанк (2)
  Другие (65)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 119)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Доверенная среда (1, 13)
  Цифра (2, 10)
  Другие (259, 127)

  Доверенная среда (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 12)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Netrika (Нетрика) (1, 1)
  Другие (7, 7)

  БизнесАвтоматика НПЦ (1, 5)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  Цифра (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Датакаталог (1, 2)
  Другие (14, 14)

  БизнесАвтоматика НПЦ (1, 7)
  Сбербанк (2, 2)
  Датакаталог (1, 2)
  СПбГУ ИТМО (Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики) (1, 2)
  Цифра (1, 2)
  Другие (14, 16)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 119 (119, 0)
  Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 24 (0, 24)
  Доверенная среда: Триафлай BI-платформа - 13 (13, 0)
  ZIIoT Платформа для работы с промышленными данными - 10 (10, 0)
  Другие 82

  Доверенная среда: Триафлай BI-платформа - 5 (5, 0)
  ZIIoT Платформа для работы с промышленными данными - 4 (4, 0)
  Visary BI Платформа бизнес-аналитики - 3 (3, 0)
  Большая Тройка: АИС Редактор территориальных схем - 2 (2, 0)
  Цифровая Траектория: Action Track (ATC) - 2 (2, 0)
  Другие 8

  Visary BI Платформа бизнес-аналитики - 12 (12, 0)
  Росатом Цифровое ресурсоснабжение - 3 (1, 2)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  Yabbi Smart Panel (YSP) - 1 (1, 0)
  МегаФон: Цифровой туризм - 1 (1, 0)
  Другие 1

  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Росатом Цифровое ресурсоснабжение - 4 (1, 3)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Arenadata Catalog - 2 (2, 0)
  Другие 4

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 5 (0, 5)
  Luxms BI - 2 (2, 0)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Arenadata Catalog - 2 (2, 0)
  Другие 2