VK Cloud Voice (ранее Mail.ru Cloud Voice)

Продукт
Название базовой системы (платформы): VK Cloud Универсальная облачная платформа для развития цифровых сервисов (ранее VK Cloud Solutions)
Разработчики: VK Tech (ранее VK Цифровые технологии, ВК Цифровые технологии и Mail.ru Цифровые технологии)
Дата последнего релиза: 2021/10/05
Технологии: Речевые технологии

Основные статьи:

Платформа VK Cloud Voice (ранее Mail.ru Cloud Voice) способна распознавать речь и синтезировать естественный голос. Технология Voice ASR (Automatic Speech Recognition, автоматическое распознавание речи) быстро переводит звуковой файл в удобный для восприятия текст: сервис автоматически разбивает его на предложения и расставляет знаки препинания. Технология Voice TTS (Text-to-speech, генератор естественной речи) основана на машинном обучении. Благодаря этому сгенерированный программой голос не отличим от человеческой речи.

2021: Доступность в облаке Mail.ru Cloud Solutions

В облаке Mail.ru Cloud Solutions открыт доступ к платформе распознавания и синтеза речи на основе машинного обучения Mail.ru Cloud Voice. Она поможет компаниям быстро внедрить речевые технологии в свои цифровые сервисы и приложения. Платформа построена с использованием технологий голосового помощника Маруся. Об этом компания Mail.ru Cloud Solutions сообщила 5 октября 2021 года.

Облачный сервис Mail.ru Cloud Voice поможет компаниям проанализировать звонки клиентов, добавить голосовое управление к приложению, озвучить контент на сайте, адаптировать сервис для людей с ограниченными возможностями. Например, слабовидящие люди смогут прослушать информацию, представленную в приложении, и давать команды голосом.

Все вычисления происходят на стороне облачного провайдера, за счет чего сервис Mail.ru Cloud Voice не требует от клиента значительных вычислительных ресурсов и обеспечивает быстродействие на любых устройствах. Это позволяет обрабатывать огромные массивы данных и демонстрировать максимальную точность распознавания, что невозможно реализовать на самих устройствах.

Речевые технологии Mail.ru Cloud Voice интегрируются в любые сервисы независимо от платформы и языка разработки благодаря универсальному Rest API. Достаточно наложить платформу на необходимую бизнес-логику и интегрировать в приложение или сервис. Технологии Voice ASR и Voice TTS на платформе Mail.ru Cloud Voice постоянно совершенствуются, разработчики и конечные пользователи получают улучшения автоматически.

Сервис Mail.ru Cloud Voice оплачивается по факту использования — только за количество символов озвученного текста или количество распознанных минут аудио.

«
Платформа Mail.ru Cloud Voice позволяет большому кругу компаний внедрить в бизнес речевые технологии. Не нужно разрабатывать с нуля алгоритмы распознавания речи и модели машинного обучения, разворачивать серьезную инфраструктуру и нанимать штат разработчиков. Можно взять готовую технологию и в считанные дни улучшить свои цифровые сервисы. Это поможет привлечь аудиторию, которая раньше не могла ими пользоваться, или автоматизировать обслуживание клиентов, ускорив процесс и сделав его удобнее, — сказал Дмитрий Лазаренко, директор по продукту Mail.ru Cloud Solutions.
»



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (44)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (25)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (14)
  Другие (167)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  SteadyControl (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  3iTech (ранее 3i Technologies) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (6)
  Naumen (Наумен консалтинг) (4)
  Другие (23)

  SteadyControl (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Яндекс (Yandex) (2)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  Другие (11)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 27)
  SteadyControl HoReCa (1, 23)
  SteadyControl (1, 23)
  Другие (317, 179)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl HoReCa (1, 4)
  SteadyControl (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (15, 23)

  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 4)
  Яндекс (Yandex) (1, 3)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (11, 12)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ Голосовой бот - 28 (4, 24)
  SteadyControl Система контроля и управления персоналом - 23 (23, 0)
  BSS Digital2Speech - 20 (20, 0)
  Voice2Med Система распознавания речи в медицине - 14 (14, 0)
  Naumen Erudite - 12 (12, 0)
  Другие 125

  BSS Digital2Speech - 5 (5, 0)
  SteadyControl Система контроля и управления персоналом - 4 (4, 0)
  Voice2Med Система распознавания речи в медицине - 4 (4, 0)
  МТТ Голосовой бот - 2 (0, 2)
  Neuro.net Голосовой робот - 2 (2, 0)
  Другие 8

  МТТ Голосовой бот - 12 (1, 11)
  BSS Digital2Speech - 6 (6, 0)
  Naumen Erudite - 3 (3, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  SteadyControl Система контроля и управления персоналом - 3 (3, 0)
  Другие -1

  МТТ Голосовой бот - 9 (0, 9)
  BSS Digital2Speech - 7 (7, 0)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  SmartLogger II - 4 (4, 0)
  Другие 9

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  YandexGPT (YaLM 2.0) - 3 (3, 0)
  BSS: Виртуальный голосовой ассистент - 2 (2, 0)
  BSS Digital2Speech - 2 (2, 0)
  МТТ Голосовой бот - 1 (1, 0)
  Другие 8