ORBL Биометрическая система распознавания лиц и речи

Продукт
Разработчики: ORBL (ОРБЛ)
Дата премьеры системы: 2020/02/13
Отрасли: ЖКХ, сервисные и бытовые услуги,  Недвижимость,  Торговля,  Фармацевтика, медицина, здравоохранение
Технологии: ИБ - Биометрическая идентификация,  Речевые технологии,  Системы видеоаналитики

2020: Запуск системы распознавания речи в коммерческую эксплуатацию

13 февраля 2020 года компания ORBL запустила в коммерческую эксплуатацию b2b-продукт – систему распознавания речи высокой точности. Это дескриптор голоса, с помощью которого можно переводить в текст спонтанную потоковую речь.

Какие данные можно получить с помощью программы распознавания речи:

  • эмоциональный окрас речи (восемь эмоций – по спектру от гнева до радости);
  • демографические характеристики говорящего (пол и возраст);
  • полноценную стенограмму аудиоданных для дальнейшей аналитики.

ORBL запустила в коммерческую эксплуатацию систему распознавания речи высокой точности
«
«К запуску представленной функции ORBL подтолкнул запрос со стороны существующих клиентов, которые уже пользуются видеоаналитикой. Дело в том, что в совокупности оба решения – распознавание лиц и распознавание речи - дают некую синергию, которая выражается в полноте данных для принятия управленческих решений. С технической точки зрения функция распознавание речи не несёт дополнительных нагрузок на аппаратуру, оба процесса реализовываются на одном устройстве в рамках общей архитектуры. Распознавание сразу и лица, и голоса помогают общему решению работать оптимально, а бизнесу - получать бенефиты от единой архитектуры»,

отметил Антон Рудов, генеральный директор и основатель ORBL
»

Прежде чем запустить продукт в коммерческую эксплуатацию, ORBL провели несколько пилотов с банками, медучреждениями. Со слов разработчика, положительная обратная связь от заказчиков говорит о том, что технология может быть использована в самых разных отраслях:

  • Ритейл и сфера услуг. Это прежде всего компании, которые захотели фиксировать работу своих сотрудников в офисах и отделах продаж (магазинах) не только на видео, но и с помощью аудио. В ритейле распознавание голоса нужно для того, чтобы понимать, как происходило общение с покупателями, например, на кассе. В сфере услуг (например, салоны красоты и дилерские центры) решение помогает контролировать работу консультантов. Речь сотрудников записывается в личные микрофоны и затем преобразовывается в текст, который система анализирует на соответствие скриптам. Это очень помогает также при разборе конфликтных ситуаций с клиентами.
  • Колл-центры тоже могут контролировать сотрудников на предмет того, насколько точно они следуют скриптам в ходе разговора с клиентами. Особенно это актуально для служб поддержки банков.
  • Маркетинговые службы могут анализировать настроение клиентов, а также испытываемые в момент беседы эмоции, после чего выводить средние показатели удовлетворенности.
  • Медицинская сфера. Например, при проведении вскрытия патологоанатомы могут заносить данные в информационную систему, «заполняя» голосом нужные поля.
  • Системы аутентификации. Голос человека неповторим и его невозможно подделать. В контроле доступа по голосу заинтересованы, например, различные helpdesk системы. Голосовая биометрия для доступа к учётной записи по телефону не только распознает голос и сверяет его с образцом в базе, но и умеет отличать «живого» собеседника от записанной заранее речи. Для этого используется «капча» - робот просит собеседника просят повторить спонтанно выбранную фразу.

Технические характеристики:

  • Программа может обрабатывать аудиоданные, полученные через различные устройства – например, диктофон или телефон. Конечное качество распознавания зависит от исходного качества данных. Минимальный результат – это «захват» ключевых слов, а при достаточном качестве записи заказчик получает готовую стенограмму.
  • Точность распознавания при записи на диктофон достигает 95-96% при спонтанной речи, то есть когда человек не диктует или не старается специально четко проговаривать слова). Это позволяет получить готовый текст с минимальным количеством опечаток и ошибок, которые можно легко исправить в ручном режиме.
  • Телефонный канал обеспечивает чуть меньшую точность – 80%. Это связано с тем, что его частота дискретизации составляет 8 кГц, тогда как при записи на диктофон – 44 кГц. Однако словарь распознавания для конкретной тематики дает прибавку точности еще в 10%. Например, для агентства недвижимости такой словарь может включать названия жилых комплексов или жаргонные обозначения типов планировок квартир.

Если говорить про точность распознавания речи в системах контроля доступа, то результат обработки голоса выражается в процентах соответствия - насколько точно он совпадает с эталонной записью в базе биометрии.

Отличия от аналогичных систем, отмеченные разработчиком:

  • Это стековое решение - распознавание лица и речи в одной архитектуре. Одновременно с высокой точностью распознавания голоса, система обеспечивает распознавание лиц с точностью 99.99997% с поворотом головы до 65 градусов, минимальной освещенности в 60 лк, со скоростью 0.3-0.4 секунды.
  • Горизонтальное масштабирование, обеспечивающее минимальное TCO для клиента.
  • Работает не только из облака, но и локально (в основном на рынке облачные решения). ORBL не использует публичные облака, что в значительной мере, по мнению разработчика, снижает риски утечки данных. Обработка данных происходит или на сервере ORBL, или на серверах заказчиков.
  • В отличие от других локальных решений, для продукта ORBL нужно меньше аппаратных ресурсов - за счёт того, что обработка данных (как видео, так и аудио) производится на видеокартах средних по мощности компьютеров. Это даёт экономию ресурсов.

Пока технические возможности системы по преобразованию речи в текст ограничены существующими запросами. Например, она не настроена на правильную расстановку знаков препинания, так как в основном используется для стандартизированного заполнения полей, а не создания литературного текста. В планах разработчика на 2020 год также есть создание интонационного распознавания речи, благодаря которому знаки препинания будут расставляться автоматически в процессе транскриптизации речи. С этой задачей вполне может справиться алгоритм машинного обучения, который проанализирует массив аудиоданных (например, аудиокниг) и выявит закономерности между интонациями говорящего и знаками препинания в тексте. Также в планах - усовершенствование функции текстовой аналитики. С её помощью заказчики смогут анализировать текстовые каналы связи с аудиторией (e-mail, чаты, форум) на предмет упоминания определённых тем и ключевых словосочетаний. Эта функция полезна и для обучения чат-ботов - чтобы они могли легко считывать опечатки и ошибки в сообщениях от клиентов, считают в ORBL. Кроме того, в компании работают над синтезом речи для создания на основе этой функции полноценных голосовых ботов, которые смогут, например, консультировать клиентов по телефону.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (134)
  Прософт Биометрикс (ProSoft Biometrics) (74)
  Индид, Indeed (ранее Indeed ID) (44)
  VisionLabs (ВижнЛабс) (34)
  Группа компаний ЦРТ (Центр речевых технологий) (30)
  Другие (473)

  Прософт Биометрикс (ProSoft Biometrics) (11)
  VisionLabs (ВижнЛабс) (7)
  Группа компаний ЦРТ (Центр речевых технологий) (5)
  РекФэйсис (4)
  Ростелеком (4)
  Другие (62)

  Индид, Indeed (ранее Indeed ID) (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  Goodt (Гудт) (2)
  NDBC - ЭнДиБиСи (ранее НТТ ДАТА Бизнес Солюшнс, itelligence Россия, Ителлидженс) (2)
  VisionLabs (ВижнЛабс) (2)
  Другие (24)

  Сбербанк (7)
  Индид, Indeed (ранее Indeed ID) (7)
  Сканпорт АйДи (Scanport) (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  VisionLabs (ВижнЛабс) (4)
  Другие (23)

  Сбербанк (2)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1)
  Voca-Tech (Вока-Тек) (1)
  ОКТРОН (1)
  САТЕЛ (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (9, 140)
  Прософт Биометрикс (ProSoft Biometrics) (18, 84)
  VisionLabs (ВижнЛабс) (26, 50)
  Индид, Indeed (ранее Indeed ID) (1, 44)
  Группа компаний ЦРТ (Центр речевых технологий) (14, 38)
  Другие (359, 322)

  Прософт Биометрикс (ProSoft Biometrics) (7, 11)
  VisionLabs (ВижнЛабс) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (2, 6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  РекФэйсис (2, 4)
  Другие (27, 36)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 6)
  Индид, Indeed (ранее Indeed ID) (1, 6)
  Goodt (1, 3)
  ABC Solutions (Эй Би Си Солюшенс) (1, 3)
  VisionLabs (ВижнЛабс) (2, 2)
  Другие (10, 11)

  Сбербанк (3, 8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 7)
  Индид, Indeed (ранее Indeed ID) (1, 7)
  VisionLabs (ВижнЛабс) (3, 6)
  Shenzhen Chainway Information Technology (1, 6)
  Другие (7, 9)

  Сбербанк (1, 2)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 1)
  Voca-Tech (Вока-Тек) (1, 1)
  Shenzhen Chainway Information Technology (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  BioLink BioTime - 177 (123, 54)
  Indeed Access Manager (Indeed AM) - 44 (44, 0)
  VisionLabs Luna - 40 (24, 16)
  Biosmart Studio - 36 (36, 0)
  СКУД BioSmart - 27 (27, 0)
  Другие 306

  VisionLabs Luna - 10 (5, 5)
  BSS Digital2Speech - 5 (5, 0)
  Voice2Med Система распознавания речи в медицине - 4 (4, 0)
  BioSmart PV‑WTC Терминал - 4 (4, 0)
  Biosmart Studio - 4 (4, 0)
  Другие 36

  Indeed Access Manager (Indeed AM) - 6 (6, 0)
  BSS Digital2Speech - 6 (6, 0)
  Goodt (Ранее ZoZo RCAM, Revenue&Costs Assurance Management) - 3 (3, 0)
  VisionLabs Luna - 2 (1, 1)
  Vmx SILA: HSE - 2 (2, 0)
  Другие 6

  BSS Digital2Speech - 7 (7, 0)
  Indeed Access Manager (Indeed AM) - 7 (7, 0)
  Shenzhen Chainway C-серия RFID-считывателей - 6 (6, 0)
  Сбербанк: Система оплаты по улыбке - 5 (5, 0)
  VisionLabs Luna - 4 (2, 2)
  Другие 7

  Сбербанк: Система оплаты по улыбке - 2 (2, 0)
  Voca Tech: Система автоматизированного контроля сотрудников для выполнения стандартов обслуживания - 1 (1, 0)
  Shenzhen Chainway C-серия RFID-считывателей - 1 (1, 0)
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  VizorLabs (Визорлабс) (41)
  Вокорд (Vocord) (39)
  ВидеоМатрикс (Videomatrix) (32)
  VisionLabs (ВижнЛабс) (25)
  Simetra (ранее А+С Транспроект) (18)
  Другие (318)

  ВидеоМатрикс (Videomatrix) (9)
  Simetra (ранее А+С Транспроект) (6)
  VisionLabs (ВижнЛабс) (5)
  VizorLabs (Визорлабс) (5)
  Талмер (Talmer) (4)
  Другие (49)

  VizorLabs (Визорлабс) (11)
  ВидеоМатрикс (Videomatrix) (8)
  Nord Clan (Норд Клан) (4)
  Джей Эс Эй Групп (JSA Group) (3)
  VisionLabs (ВижнЛабс) (2)
  Другие (30)

  VizorLabs (Визорлабс) (13)
  Ростелеком (3)
  VisionLabs (ВижнЛабс) (3)
  Транс-Телематика (3)
  Урбантех (3)
  Другие (32)

  VizorLabs (Визорлабс) (2)
  Трэктис (1)
  Университет Иннополис (1)
  ЭЛВИС-НеоТек (1)
  KAMAZ Digital (ЦП КАМАЗ) (1)
  Другие (9)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Вокорд (Vocord) (9, 45)
  VizorLabs (Визорлабс) (9, 40)
  ВидеоМатрикс (Videomatrix) (17, 32)
  VisionLabs (ВижнЛабс) (13, 32)
  PTV Group (2, 25)
  Другие (330, 179)

  ВидеоМатрикс (Videomatrix) (9, 9)
  VisionLabs (ВижнЛабс) (3, 9)
  PTV Group (1, 6)
  Ростелеком (3, 5)
  VizorLabs (Визорлабс) (2, 5)
  Другие (14, 21)

  VizorLabs (Визорлабс) (7, 11)
  ВидеоМатрикс (Videomatrix) (7, 8)
  VisionLabs (ВижнЛабс) (2, 2)
  Nord Clan (Норд Клан) (1, 2)
  Яндекс (Yandex) (1, 1)
  Другие (16, 16)

  VizorLabs (Визорлабс) (4, 13)
  Технологии безопасности дорожного движения (ТБДД) (1, 3)
  VisionLabs (ВижнЛабс) (1, 2)
  РИР (Росатом Инфраструктурные решения) (1, 2)
  Nord Clan (Норд Клан) (1, 2)
  Другие (12, 13)

  PTV Group (1, 1)
  VizorLabs (Визорлабс) (1, 1)
  Сколково Фонд (1, 1)
  ЭЛВИС-НеоТек (1, 1)
  NVI Research (1, 1)
  Другие (3, 3)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Vizorlabs Платформенное решение видеоаналитики - 36 (11, 25)
  VisionLabs Luna - 33 (24, 9)
  PTV Visum - 25 (25, 0)
  Vocord Traffic - 18 (16, 2)
  Vocord FaceControl - 18 (13, 5)
  Другие 174

  VisionLabs Luna - 11 (5, 6)
  PTV Visum - 6 (6, 0)
  Vizorlabs Платформенное решение видеоаналитики - 4 (0, 4)
  SecurOS - 3 (2, 1)
  Hikvision HikCentral - 3 (3, 0)
  Другие 17

  Vizorlabs Платформенное решение видеоаналитики - 7 (1, 6)
  Nord Clan: RDetector - 2 (2, 0)
  Vmx SILA: HSE - 2 (2, 0)
  VisionLabs Luna - 2 (1, 1)
  Smart Meal Service: Lunch fastPass Робот-кассир - 1 (1, 0)
  Другие 18

  Vizorlabs Платформенное решение видеоаналитики - 11 (2, 9)
  ТБДД: Азимут Комплексы фотовидеофиксации - 3 (3, 0)
  VisionLabs Luna - 2 (2, 0)
  Nord Clan: ML Sense - 2 (2, 0)
  Русатом Интеллектуальная транспортная система - 2 (2, 0)
  Другие 4

  Vizorlabs Платформенное решение видеоаналитики - 1 (0, 1)
  Softline Digital: RozniTech Платформа для сетевого ритейла (ранее Retailix.Ai) - 1 (1, 0)
  NVI Solutions: owl.Guard - 1 (1, 0)
  PTV Visum - 1 (1, 0)
  Tracktice Система подсчета пассажиропотока - 1 (1, 0)
  Другие -1