BSS TTS (Text To Speech)

Продукт
Разработчики: Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС)
Дата последнего релиза: 2024/02/21
Технологии: Речевые технологии

Основные статьи:

2024: Оптимизация создания голосового помощника

Компания BSS доработала свою TTS – программное решение для синтеза речи. Теперь для создания нового голоса достаточно часовой записи диктора вместо требовавшихся ранее 20 часов. Об этом BSS сообщила 21 февраля 2024 года.

Технология TTS (Text To Speech) позволяет воссоздать (синтезировать) голос конкретного человека для озвучивания виртуального помощника. Например, голос диктора или известной личности, если они являются частью имиджа компании.

Обычно для создания уникального голоса используется гибридный подход TTS, где реплики живого человека сочетаются с синтезированной речью. Диктор озвучивает статические реплики, тем самым сохраняя естественность и богатство интонаций. Синтез используется для озвучивания переменных: дат, фамилий, тарифов, адресов и т.д. Такой подход позволяет голосовому помощнику корректно передавать эмоции и интонации в разговоре с клиентом.

Ранее для создания уникального голоса требовалось от 15 до 20 часов аудиоматериала. Для справки: за один студийный день удается записать от 1 до 2 часов материала. Обычно сроки разработки увеличиваются, поскольку необходимо состыковать расписание студии, диктора и сроки проекта. У заказчиков возникает зависимость от расписания диктора: необходимо найти 10-15 свободных дней у диктора для записи материалов.

Экономия времени заказчиков и оптимизация их расходов стали главными задачами команды BSS при разработке обновленной версии. Так было подготовлено большое обновление со сменой базовой технологии обучения. В данной версии TTS для создания уникального голоса необходимо 1-2 часа аудиоматериалов. Это всего лишь 1 рабочий день студии.

Разработчики BSS ускорили процесс создания уникального голоса, сохранили качество записи, а также сделали возможной оптимизацию расходов заказчика.

«
Заказчикам нравится естественность речи при сочетании записанных диктором статических фраз с синтезированными динамическими фрагментами, которые звучат тем же голосом. Все большее число компаний, при внедрении голосовых помощников выбирают такой подход. На февраль 2024 года мы ведем несколько проектов с использованием гибридного TTS с обучением на одном часе аудио и планируем, что это станет массовым. В свою очередь работаем над повышением качества записи и эмоциональностью синтезированной речи, – прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
»



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (44)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (25)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (14)
  Другие (167)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  SteadyControl (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  3iTech (ранее 3i Technologies) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (6)
  Naumen (Наумен консалтинг) (4)
  Другие (23)

  SteadyControl (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Яндекс (Yandex) (2)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  Другие (11)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 27)
  SteadyControl HoReCa (1, 23)
  SteadyControl (1, 23)
  Другие (317, 179)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl HoReCa (1, 4)
  SteadyControl (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (15, 23)

  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 4)
  Яндекс (Yandex) (1, 3)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (11, 12)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ Голосовой бот - 28 (4, 24)
  SteadyControl Система контроля и управления персоналом - 23 (23, 0)
  BSS Digital2Speech - 20 (20, 0)
  Voice2Med Система распознавания речи в медицине - 14 (14, 0)
  Naumen Erudite - 12 (12, 0)
  Другие 125

  BSS Digital2Speech - 5 (5, 0)
  SteadyControl Система контроля и управления персоналом - 4 (4, 0)
  Voice2Med Система распознавания речи в медицине - 4 (4, 0)
  МТТ Голосовой бот - 2 (0, 2)
  Neuro.net Голосовой робот - 2 (2, 0)
  Другие 8

  МТТ Голосовой бот - 12 (1, 11)
  BSS Digital2Speech - 6 (6, 0)
  Naumen Erudite - 3 (3, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  SteadyControl Система контроля и управления персоналом - 3 (3, 0)
  Другие -1

  МТТ Голосовой бот - 9 (0, 9)
  BSS Digital2Speech - 7 (7, 0)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  SmartLogger II - 4 (4, 0)
  Другие 9

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  YandexGPT (YaLM 2.0) - 3 (3, 0)
  BSS: Виртуальный голосовой ассистент - 2 (2, 0)
  BSS Digital2Speech - 2 (2, 0)
  МТТ Голосовой бот - 1 (1, 0)
  Другие 8