HunyuanVideo (нейросеть)

Продукт

Разработчики:	Tencent Holdings
Дата премьеры системы:	декабрь 2024 г.
Отрасли:	Интернет-сервисы

Содержание

История
- 2024: Запуск продукта
Примечания

История

2024: Запуск продукта

В начале декабря 2024 года китайская корпорация Tencent Holdings объявила о запуске нейросети HunyuanVideo. Это, как утверждается, самая крупная в мире открытая ИИ-модель для генерации видео.

HunyuanVideo создает видеоматериалы на основе текстовых подсказок. По заявлениям Tencent, нейросеть предназначена для генерации высококачественных «гиперреалистичных» роликов с возможностью изменения ракурса камеры. Например, можно попросить ИИ-модель показать кошку в киберпанковском пейзаже, серфера на волне или несколько воздушных шаров, медленно поднимающихся в небо.

Tencent запустила нейросеть, генерирующую видео по тексту

HunyuanVideo насчитывает более 13 млрд параметров. На момент запуска нейросеть воспринимает текстовые задания на английском или китайском языках. Доступны различные варианты стиля, качества и размера видеороликов. В частности, HunyuanVideo способна генерировать материалы в разрешении 720p длительностью до пяти секунд. Пользователям предлагаются расширенные настройки кинопроизводства.

Новая нейросеть доступна бесплатно как для индивидуальных пользователей, так и для компаний. С момента выпуска базовой ИИ-модели Huanyuan в сентябре 2023 года корпорация Tencent постепенно расширяет возможности платформы. В частности, в марте 2024-го компания в сотрудничестве с Гонконгским университетом науки и технологий и Университетом Цинхуа представила инструмент преобразования изображений в видео Follow-Your-Click. А позднее появилась возможность преобразования текста в изображения. Модель HunyuanVideo основана на архитектуре Diffusion Transformer, которая лежит в основе Sora — ИИ-генератора видео, представленного компанией OpenAI в начале 2024 года. Данная система, как утверждается, может создавать реалистичные сцены по текстовым инструкциям.^[1]