3i Speech Recognition API

Продукт
Разработчики: 3iTech (ранее 3i Technologies)
Дата премьеры системы: 2017/02/14
Дата последнего релиза: 2017/07/20
Технологии: ИБ - Биометрическая идентификация,  Речевые технологии,  Средства разработки приложений

Содержание

3i Speech Recognition API — облачный сервис для распознавания речи из медиаконтента и последующей профессиональной обработки.

2017

3i Speech Recognition: финальная версия

20 июля 2017 года консорциум 3i Technologies объявил о завершении формирования функционала облачного сервиса для профессиональной обработки речевых данных 3i Speech Recognition, предназначенного для работы с медиаконтентом и потоками голосовой информации в контакт-центрах. Сервис позволяет с точностью более 90% переводить «речь» в текстовый формат, параллельно редактируя его в пользовательском интерфейсе.

На финальной стадии 3i Speech Recognition дополнился личным кабинетом, хранилищем и редакторским интерфейсом, в котором можно обрабатывать текстовую информацию. Сервис позволяет работать с записями ТВ и радиоэфиров, материалами продакшн-студий, обращениями в контакт-центры и т.д. По словам разработчиков, 3i Speech Recognition дает возможность загружать в персонализированное облачное хранилище до 18 часов аудиоинформации, обрабатывая ее в несколько раз быстрее реального времени звучания. Затем выдается «стройный» текст, разбитый на предложения с расставленными знаками препинания. При прослушивании исходного материала система автоматически «подсвечивает» произносимый фрагмент в текстовом блоке.

В целом, по словам председателя совета директоров консорциума 3i Technologies Алексея Любимова, сервис ориентирован на специалистов, работающих с голосовой информацией и будет полезен службам контроля качества в контакт-центрах или консультантам, создающим сценарии телемаркетинговых акций, а также подразделениям телеканалов, которые занимаются расшифровкой телеэфиров.Международный конгресс по anti-age и эстетической медицине — ENTERESTET 2026

Сервис отличают высокая точность распознавания речи, автоматическая расстановка знаков препинания, удобный редакторский интерфейс, который позволяет вносить правки в распознанный текст, и возможность интеграции с наиболее распространенными программными платформами автоматизации совместной деятельности рабочих групп.

В 3i Speech Recognition используются языковые и акустические модели, построенные с применением машинного обучения, технологий рекуррентных нейронных сетей (Recurrent Neural Network, RNN) и взвешенных конечных автоматов (Weighted Finite State Transducer, WFST). Вычислительная инфраструктура реализована с ускорением на GPU, что позволяет получать многократный прирост производительности относительно CPU.

Языковые модели для повышения качества распознавания могут быть адаптированы под узкую предметную область. Например, для перевода в текст телепередач определенной тематики или для обработки узкоспециализированных телемаркетинговых сценариев.

Сервис поддерживает русский, английский, китайский, немецкий и испанский языки. Кроме того, в 3i Speech Recognition может быть интегрирован сервис машинного перевода.

Тестовая версия сервиса доступна по ссылке.

Представлена бета-версия 3i Speech Recognition

14 февраля пресс-служба консорциума 3i Technologies сообщила о разработке облачного сервиса для профессиональной обработки речевых данных 3i Speech Recognition API. Сервис с точностью более 90% переводит теле- и радиоэфиры, медиа-архивы ТВ-каналов и радиостанций в текстовый формат.

3i Speech Recognition API работает с аудио и видео любой длительности, обрабатывает загруженные в облако файлы в несколько раз быстрее реального времени звучания и формирует на выходе текст, разбитый на предложения, включая знаки препинания.

Осциллограмма звука, (2015)

Бета-версия 3i Speech Recognition API открыта для публичного тестирования.

«
Это специализированный сервис, ориентированный на обработку именно телевизионного или радио-контента. Мы разработали уникальные модели, которые позволили добиться очень высокой точности распознавания. Надеемся, что сервис будет полезен профессионалам, которые работают с медиа-контентом. В дальнейшем он может стать частью высокотехнологичных решений для массового потребителя, например, основой для перевода иностранных каналов и субтитрирования в режиме реального времени. Все технологии для создания такого продукта у компаний, входящих в консорциум, уже есть.

Алексей Любимов, председатель совета директоров консорциума 3i Technologies
»

В сервисе используются языковые и акустические модели, созданные с использованием машинного обучения, технологий рекуррентных нейронных сетей (Recurrent Neural Network, RNN) и взвешенных конечных автоматов (Weighted Finite State Transducer, WFST). Вычислительная инфраструктура реализована на основе GPU, что дает многократный прирост производительности, в сравнении с CPU.

Языковые модели для повышения качества распознавания могут быть адаптированы под узкую предметную область, например, для перевода в текст «экономических» или «отраслевых» передач, в которых спикеры используют профессиональную лексику.

Бета-версия 3i Speech Recognition поддерживает русский и английский язык. По мнению создателей сервиса, 3i Speech Recognition будет полезен для разработчиков программного обеспечения, системных интеграторов, специалистов в области создания и обработки медиаконтента (телерадиовещательные компании, продакшн-студии, креативные агентства, фрилансеры и т.д.).



РЕШЕНИЕ НА БАЗЕ (1) СМ. ТАКЖЕ (2)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (134)
  Прософт Биометрикс (ProSoft Biometrics) (74)
  Индид, Indeed (ранее Indeed ID) (47)
  VisionLabs (ВижнЛабс) (38)
  Группа компаний ЦРТ (Центр речевых технологий) (32)
  Другие (496)

  Индид, Indeed (ранее Indeed ID) (7)
  Сбербанк (7)
  Сканпорт АйДи (Scanport) (6)
  VisionLabs (ВижнЛабс) (4)
  АйТи Бастион (3)
  Другие (15)

  Сбербанк (8)
  Сканпорт АйДи (Scanport) (3)
  Индид, Indeed (ранее Indeed ID) (2)
  САТЕЛ (1)
  Сбер Бизнес Софт (1)
  Другие (12)

  ОКТРОН (5)
  Центр биометрических технологий (ЦБТ) (4)
  Viant (Виант) (4)
  Сканпорт АйДи (Scanport) (3)
  VisionLabs (ВижнЛабс) (3)
  Другие (19)

  АйТи Бастион (1)
  Уральский центр систем безопасности (УЦСБ) (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (9, 140)
  Прософт Биометрикс (ProSoft Biometrics) (18, 84)
  VisionLabs (ВижнЛабс) (26, 53)
  Индид, Indeed (ранее Indeed ID) (1, 47)
  Группа компаний ЦРТ (Центр речевых технологий) (14, 41)
  Другие (374, 337)

  Сбербанк (3, 8)
  Индид, Indeed (ранее Indeed ID) (1, 7)
  VisionLabs (ВижнЛабс) (3, 6)
  Shenzhen Chainway Information Technology (1, 6)
  АйТи Бастион (1, 3)
  Другие (6, 6)

  Сбербанк (1, 8)
  Shenzhen Chainway Information Technology (1, 3)
  Индид, Indeed (ранее Indeed ID) (1, 2)
  ABC Solutions (Эй Би Си Солюшенс) (1, 1)
  Voca-Tech (Вока-Тек) (1, 1)
  Другие (5, 5)

  Shenzhen Chainway Information Technology (1, 8)
  РТК Софт Лабс (2, 3)
  Ростелеком (2, 3)
  Группа компаний ЦРТ (Центр речевых технологий) (2, 2)
  VisionLabs (ВижнЛабс) (1, 2)
  Другие (9, 10)

  АйТи Бастион (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  BioLink BioTime - 177 (123, 54)
  Indeed Access Manager (Indeed AM) - 47 (47, 0)
  VisionLabs Luna - 43 (27, 16)
  Biosmart Studio - 36 (36, 0)
  СКУД BioSmart - 27 (27, 0)
  Другие 316

  Indeed Access Manager (Indeed AM) - 7 (7, 0)
  Shenzhen Chainway C-серия RFID-считывателей - 6 (6, 0)
  Сбербанк: Система оплаты по улыбке - 5 (5, 0)
  VisionLabs Luna - 4 (2, 2)
  АйТи Бастион: СКДПУ НТ Система контроля действий поставщиков ИТ-услуг - 3 (3, 0)
  Другие 4

  Сбербанк: Система оплаты по улыбке - 8 (8, 0)
  Shenzhen Chainway C-серия RFID-считывателей - 3 (3, 0)
  Indeed Access Manager (Indeed AM) - 2 (2, 0)
  Voca Tech: Система автоматизированного контроля сотрудников для выполнения стандартов обслуживания - 1 (1, 0)
  Goodt (Ранее ZoZo RCAM, Revenue&Costs Assurance Management) - 1 (1, 0)
  Другие 3

  Shenzhen Chainway C-серия RFID-считывателей - 8 (8, 0)
  Единая биометрическая система (ЕБС) - 3 (2, 1)
  Indeed Access Manager (Indeed AM) - 2 (2, 0)
  VisionLabs Luna - 2 (2, 0)
  ЦРТ и АйВойс: Голас (Golas) Система голосового управления - 1 (1, 0)
  Другие 3

  АйТи Бастион: СКДПУ НТ Система контроля действий поставщиков ИТ-услуг - 1 (1, 0)
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Солар (Solar) (47)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (13)
  Unlimited Production (Анлимитед Продакшен, eXpress) (12)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (11)
  Другие (433)

  Солар (Solar) (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  Солар (Solar) (4)
  Axiom JDK (Аксиом) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Т1 Иннотех (ГК Иннотех) (1)
  Другие (13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Нота (Холдинг Т1) (2)
  Effective Technologies (Эффектив Технолоджис) (2)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Сбербанк-Технологии (СберТех) (2)
  Другие (24)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  Уральский центр систем безопасности (УЦСБ) (1)
  Другие (0)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Солар (Solar) (2, 49)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (666, 359)

  Солар (Solar) (1, 6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  Мобильные ТелеСистемы (МТС) (1, 4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Форсайт (1, 3)
  Другие (15, 24)

  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Солар (Solar) (1, 4)
  Мобильные ТелеСистемы (МТС) (2, 3)
  Axiom JDK (Аксиом) (2, 2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Другие (13, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Мобильные ТелеСистемы (МТС) (1, 4)
  Яндекс (Yandex) (1, 3)
  Python Software Foundation (1, 3)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 3)
  Другие (19, 25)

  Мобильные ТелеСистемы (МТС) (1, 1)
  Уральский центр систем безопасности (УЦСБ) (1, 1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 49 (49, 0)
  Hyperledger Fabric - 23 (23, 0)
  Windows Azure - 20 (20, 0)
  FIS Platform - 16 (16, 0)
  EXpress Защищенный корпоративный мессенджер - 16 (16, 0)
  Другие 349

  Solar appScreener (ранее Solar inCode) - 6 (6, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  МТС Exolve - 4 (4, 0)
  Форсайт. Мобильная платформа (ранее HyperHive) - 3 (3, 0)
  РЖД и Робин: Облачная фабрика программных роботов - 3 (3, 0)
  Другие 12

  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  Solar appScreener (ранее Solar inCode) - 4 (4, 0)
  МТС Exolve - 2 (2, 0)
  Axiom JDK (ранее Liberica JDK до 2022) - 2 (2, 0)
  BSS Digital2Go - 1 (1, 0)
  Другие 12

  МТС Exolve - 4 (4, 0)
  Yandex AI Studio - 3 (3, 0)
  EXpress Защищенный корпоративный мессенджер - 3 (3, 0)
  Python - 3 (3, 0)
  Т1: Сфера Платформа производства ПО - 2 (2, 0)
  Другие 16

  МТС Exolve - 1 (1, 0)
  Другие 0