DIRFA (DIverse yet Realistic Facial Animations)

Продукт
Разработчики: Наньянский технологический университет (NTU)
Дата премьеры системы: ноябрь 2023 г.
Отрасли: Информационные технологии
Технологии: Средства разработки приложений

2023: Анонс продукта

16 ноября 2023 года сингапурские исследователи из Школы компьютерных наук и инженерии в составе Наньянского технологического университета сообщили о разработке программы на основе искусственного интеллекта, которая позволяет генерировать видеоматериалы на основе одной фотографии и аудиозаписи. Система под названием DIRFA способна воспроизводить мимику и движения головы говорящего человека.

Платформа DIRFA, или DIverse yet Realistic Facial Animations, использует специальные ИИ-алгоритмы для создания 3D-видео с реалистичной и последовательной анимацией лица, синхронизированной с аудиозаписью. Новое решение, как утверждается, позволяет обойти недостатки аналогичных программ, которые могут сталкиваться с проблемами при вариации поз и воспроизведении эмоций. Для обучения генеративной ИИ-модели использовано свыше 1 млн аудиовизуальных клипов от более чем 6000 человек, которые взяты из базы данных с открытым исходным кодом The VoxCeleb2 Dataset. В результате, программа научилась предсказывать речевые сигналы и связывать их с мимикой и движениями головы.

Сингапурские исследователи сообщили о разработке программы, которая позволяет генерировать видеоматериалы на основе одной фотографии и аудиозаписи

Исследователи говорят, что создание реалистичных выражений лица на основе аудиозаписей представляет собой сложную задачу. Люди произносят одни и те же слова по-разному в различных контекстах. Поэтому для идентичных фраз может подходить несколько выражений лица. Авторы проекта подчеркивают, что речь обычно имеет сильные ассоциации с движениями губ, но более слабые связи с выражением лица и положением головы. Поэтому команда сосредоточилась на создании программы, которая максимально точно воспроизводит именно движения губ.

Пример создания реалистичного видео

По мнению разработчиков, DIRFA может привести к появлению новых приложений в различных областях, включая здравоохранение. К примеру, могут создаваться более реалистичные аватары, которые помогут людям с нарушениями речи или парализованным пациентам более точно передавать свои мысли и эмоции.[1]

Примечания



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (46)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (11)
  Axiom JDK (БеллСофт) ранее Bellsoft (10)
  Бипиум (Bpium) (10)
  Другие (393)

  Солар (ранее Ростелеком-Солар) (8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
  Консом групп, Konsom Group (КонсОМ СКС) (2)
  ЛАНИТ - Би Пи Эм (Lanit BPM) (2)
  IFellow (АйФэлл) (2)
  Другие (30)

  Солар (ранее Ростелеком-Солар) (10)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Форсайт (3)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  КРИТ (KRIT) (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Robin (Робин) (3)
  Форсайт (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Солар (ранее Ростелеком-Солар) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Effective Technologies (Эффектив Технолоджис) (1)
  GMCS (1)
  Другие (11)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 48)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (607, 308)

  Солар (ранее Ростелеком-Солар) (1, 8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
  Microsoft (4, 3)
  Oracle (2, 3)
  SAP SE (2, 2)
  Другие (16, 19)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Сбербанк (1, 2)
  Другие (9, 9)

  Солар (ранее Ростелеком-Солар) (1, 6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Мобильные ТелеСистемы (МТС) (1, 4)
  SL Soft (СЛ Софт) (1, 3)
  Другие (14, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  Солар (ранее Ростелеком-Солар) (1, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Axiom JDK (БеллСофт) ранее Bellsoft (1, 1)
  Другие (14, 14)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 48 (48, 0)
  Hyperledger Fabric - 23 (23, 0)
  Windows Azure - 20 (20, 0)
  FIS Platform - 15 (15, 0)
  EXpress Защищенный корпоративный мессенджер - 12 (12, 0)
  Другие 315

  Solar appScreener (ранее Solar inCode) - 8 (8, 0)
  FIS Platform - 4 (4, 0)
  Парадокс: MES Builder - 2 (2, 0)
  Java - 2 (2, 0)
  Siemens Xcelerator - 2 (2, 0)
  Другие 21

  Solar appScreener (ранее Solar inCode) - 11 (11, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  BSS Digital2Go - 3 (3, 0)
  Cloud ML Space - 2 (2, 0)
  Axiom JDK (ранее Liberica JDK до 2022) - 1 (1, 0)
  Другие 7

  Solar appScreener (ранее Solar inCode) - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  МТС Exolve - 4 (4, 0)
  РЖД и Робин: Облачная фабрика программных роботов - 3 (3, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  Другие 12

  EXpress Защищенный корпоративный мессенджер - 4 (4, 0)
  Solar appScreener (ранее Solar inCode) - 3 (3, 0)
  МТС Exolve - 2 (2, 0)
  Т1: Сфера Платформа производства ПО - 1 (1, 0)
  BSS Digital2Go - 1 (1, 0)
  Другие 10