Yandex Cloud SpeechSense

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Яндекс.Облако (Yandex Cloud)
Дата премьеры системы: 2024/03/11
Технологии: Речевые технологии

Основные статьи:

2024: Представление нейросети-эмпата

Нейросеть-эмпат от облачной платформы Yandex Cloud поможет бизнесу лучше понять эмоции клиентов. Об этом разработчик сообщил 11 марта 2024 года.

Алгоритм способен по голосу распознать эмоции человека во время диалога. Данная ML-модель уже может определить негатив, неформальные высказывания и нецензурную лексику, а также пол спикера и его фразы в диалоге. В будущем алгоритм заработает в связке с YandexGPT: вместе нейросети смогут распознать более сложные эмоции, в частности – сарказм.Вебинар: «Управление качеством в фарме: от зарубежных решений и бумаги — к российской системе Docs5 EQMS»

Нейросеть-эмпат разработана на базе технологии распознавания речи Yandex SpeechKit. С ее помощью компании смогут создавать голосовых помощников и виртуальных операторов колл-центров, которые умеют понимать человеческие эмоции. Это позволит бизнесу улучшить качество аналитики телефонных разговоров, а также лучше адаптировать работу колл-центров под каждого клиента и оперативно реагировать на внештатные ситуации во время диалога.

ML-модель работает в потоковом режиме – расшифровка и анализ эмоций происходит сразу во время разговора. Например, если абонент негативно общается с голосовым помощником, нейросеть может передать информацию об этом во внутреннюю систему заказчика, которая автоматически переключит его на сотрудника колл-центра. Если же оператор нагрубил клиенту, эта система оповестит менеджмент о проблемах во время разговора.

Алгоритм может определять эмоции не только по содержанию речи спикера, но и по голосу – по скорости речи, высоте,тембру и другим параметрам. Нейросеть также определяет пол участников разговора и поддерживает технологию speaker labeling – она отмечает, кому принадлежит та или иная реплика. Это позволяет полноценно работать с одноканальными звуковыми дорожками: например, при записи с диктофона или при технологических ограничениях виртуальной АТС. Кроме того, ML-модель расширяет возможности оффлайн-аналитики: данные от нейросети помогут понять, какие именно темы и формулировки от оператора вызывают негатив у клиента, и позволит оптимизировать сценарии коммуникации.

Вскоре новая модель заработает в сервисе речевой аналитики SpeechSense, который включает в себя технологии Yandex SpeechKit и интегрирован с генеративной нейросетью YandexGPT. Взаимодействие нескольких ML-моделей позволит распознать более сложные эмоции спикера – например, неуверенность или сарказм. Также нейросети смогут оценить, насколько оператор действительно погрузился в проблему клиента, пытался ли помочь решению или старался как можно быстрее завершить разговор.

«
При разработке ML-сервисов мы всегда учитываем обратную связь рынка. Один из запросов наших клиентов и партнеров – умение определять эмоции при распознавании речи. Теперь эта функция доступна каждому пользователю. В будущем в рамках сервиса речевой аналитики SpeechSense мы планируем значительно расширить список распознаваемых эмоций и дать возможность клиентам самим выбирать, какие эмоции им необходимо определять, – отметил руководитель ML-сервисов Yandex Cloud Василий Ершов.
»



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (41)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (29)
  SteadyControl (19)
  Сбербанк (18)
  Другие (265)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Другие (28)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Проф ИТ (Prof IT) Ростов-на-Дону (3)
  Другие (39)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (8)
  Сбербанк (6)
  ОБИТ (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Другие (31)

  Сбербанк (3)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  ОБИТ (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 50)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (6, 42)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (13, 32)
  Сбербанк (24, 27)
  SteadyControl (1, 24)
  Другие (512, 308)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 6)
  Другие (18, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Другие (29, 47)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 8)
  Сбербанк (2, 8)
  СалютДевайсы (ранее SberDevices) (2, 8)
  Яндекс (Yandex) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4, 4)
  Другие (25, 32)

  СалютДевайсы (ранее SberDevices) (2, 4)
  Сбербанк (2, 4)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (1, 2)
  Т-Банк (1, 1)
  TargetAI (Таргет плюс) (1, 1)
  Другие (5, 5)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  МТС Exolve Голосовой робот - 31 (7, 24)
  SteadyControl Система контроля и управления персоналом - 24 (24, 0)
  Сбер: GigaChat (ГигаЧат) - 23 (20, 3)
  BSS Digital2Speech - 21 (21, 0)
  EXpress Защищенный корпоративный мессенджер - 16 (16, 0)
  Другие 220

  МТС Exolve Голосовой робот - 9 (0, 9)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  BSS Digital2Speech - 5 (5, 0)
  SmartLogger II - 4 (4, 0)
  Другие 12

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  EXpress Защищенный корпоративный мессенджер - 5 (5, 0)
  BSS Digital2Speech - 4 (4, 0)
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3 (3, 0)
  Napoleon IT отзывы - 3 (3, 0)
  Другие 36

  Сбер: GigaChat (ГигаЧат) - 8 (7, 1)
  МТС Exolve Виртуальная АТС - 6 (6, 0)
  YandexGPT - 4 (4, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  EXpress Защищенный корпоративный мессенджер - 3 (3, 0)
  Другие 25

  Сбер: GigaChat (ГигаЧат) - 4 (3, 1)
  Lad: GPTZator - 2 (2, 0)
  LazyDoc Программный комплекс для заполнения и анализа медицинской документации - 1 (1, 0)
  T-Bank VoiceKit - 1 (0, 1)
  Targetai Платформа-конструктор для создания, тестирования и мониторинга LLM-агентов - 1 (1, 0)
  Другие 0