Разработчики: | Tencent Holdings |
Дата премьеры системы: | декабрь 2024 г. |
Отрасли: | Интернет-сервисы |
Содержание |
История
2024: Запуск продукта
В начале декабря 2024 года китайская корпорация Tencent Holdings объявила о запуске нейросети HunyuanVideo. Это, как утверждается, самая крупная в мире открытая ИИ-модель для генерации видео.
HunyuanVideo создает видеоматериалы на основе текстовых подсказок. По заявлениям Tencent, нейросеть предназначена для генерации высококачественных «гиперреалистичных» роликов с возможностью изменения ракурса камеры. Например, можно попросить ИИ-модель показать кошку в киберпанковском пейзаже, серфера на волне или несколько воздушных шаров, медленно поднимающихся в небо.
HunyuanVideo насчитывает более 13 млрд параметров. На момент запуска нейросеть воспринимает текстовые задания на английском или китайском языках. Доступны различные варианты стиля, качества и размера видеороликов. В частности, HunyuanVideo способна генерировать материалы в разрешении 720p длительностью до пяти секунд. Пользователям предлагаются расширенные настройки кинопроизводства.
Новая нейросеть доступна бесплатно как для индивидуальных пользователей, так и для компаний. С момента выпуска базовой ИИ-модели Huanyuan в сентябре 2023 года корпорация Tencent постепенно расширяет возможности платформы. В частности, в марте 2024-го компания в сотрудничестве с Гонконгским университетом науки и технологий и Университетом Цинхуа представила инструмент преобразования изображений в видео Follow-Your-Click. А позднее появилась возможность преобразования текста в изображения. Модель HunyuanVideo основана на архитектуре Diffusion Transformer, которая лежит в основе Sora — ИИ-генератора видео, представленного компанией OpenAI в начале 2024 года. Данная система, как утверждается, может создавать реалистичные сцены по текстовым инструкциям.[1]