ЦРТ: Технология кластерного анализа массивов речевых данных

Продукт
Разработчики: ЦРТ-инновации
Дата премьеры системы: 2016
Технологии: Call-центры,  Речевые технологии

Компания «ЦРТ-инновации» совместно с Министерством образования РФ разработала технологию кластерного анализа – автоматического структурирования и понимания больших массивов речевых данных. Технология базируется на основных принципах работы с большими данными и использует для реализации алгоритмов наиболее успешные современные методы машинного обучения.

Разработка будет применяться в крупных контакт-центрах и службах поддержки, где ежедневно накапливается большой объем записей телефонных переговоров «клиент-оператор» и часто возникает необходимость получить информацию о составе, структуре и содержании новой, незнакомой аналитику базы данных.

Полученная информация может быть использована для выявления наиболее частых поводов обращения абонентов в контакт-центр, обнаружения связи между этими обращениями, определения объемов кластеров таких обращений, перевода обслуживания по некоторым типам обращений в автоматический режим (IVR) и т.п.

«Достоинствами разработанной нами технологии являются возможность автоматической адаптации используемого алгоритма к новой предметной области (обучение системы на целевой выборке происходит без участия эксперта-аналитика, что делает данную систему экономически выгодной и более производительной) и наличие специально разработанных алгоритмов предобработки данных, позволяющих выделить наиболее информативные смысловые центры (так называемые «паттерны») диалогов «клиент-оператор» и исключить из рассмотрения неинформативные («мусорные») фрагменты диалогов, что значительно повышает надежность и результативность», - комментирует R&D директор Группы ЦРТ Левин Кирилл.

Технология кластерного анализа входит в состав предлагаемой «ЦРТ-инновации» универсальной методики, основанной на таких последовательных принципах извлечения информации (information retrieval) из неструктурированных массивов речевых данных и их интеллектуального анализа (data mining), как:

Предлагаемая «ЦРТ-инновации» универсальная методика основана на таких последовательных принципах извлечения информации (information retrieval) из неструктурированных массивов речевых данных и их интеллектуального анализа (data mining), как:

  • Кластерный анализ (или «кластеризация») речевых данных, предполагающий разделение массива неструктурированных данных на кластеры, объединяемые общим критерием (темой). Полученные кластеры имеют озаглавленную иерархическую (древовидную) структуру, что позволяет решать реальные задачи аналитиков контакт-центров, так как такое представление данных в полной мере отражает связность, вложенность и относительный объем данных различных кластеров (тем). Алгоритм основан на методе машинного обучения «без учителя» (unsupervised learning) с применением алгоритмов k-means и LDA на каждом шаге иерархической кластеризации.
  • Поиск и фильтрация «статистических выбросов» или «аномалий», то есть звукозаписей переговоров, нетипичных для данной выборки по какому-либо критерию (например, наличие бытовых разговоров (с родственниками или знакомыми) среди звукозаписей рабочих переговоров). Алгоритм основан на методе машинного обучения «без учителя» (unsupervised learning), использующего метод one-class-svm.
  • Выявление наиболее значимых слов и фраз и последующее составление текстовых аннотаций, содержащих в себе информативную составляющую речи.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (231)
  ИнтелТелеком (Инфинити Трейд) (135)
  Системы КлиК (ранее BMicro, БМикро) (107)
  МайАстериск (myAsterisk) (104)
  Телефонные Системы (Oktell) (35)
  Другие (707)

  Naumen (Наумен консалтинг) (6)
  Ростелеком (5)
  CTI (СиТиАй) Communications. Technology. Innovations. (2)
  L2U (Л2Ю) (2)
  Neuro.net (Нейро) (2)
  Другие (31)

  Naumen (Наумен консалтинг) (16)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  САТЕЛ (2)
  Voximplant (Фастком) (1)
  АМТ-Груп (AMT Group) (1)
  Другие (13)

  Naumen (Наумен консалтинг) (12)
  Группа компаний ЦРТ (Центр речевых технологий) (7)
  Аргус НТЦ (4)
  Mango Office (Манго Телеком) (2)
  Manzana Group (М Софт) (2)
  Другие (7)

  Naumen (Наумен консалтинг) (4)
  Аргус НТЦ (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  МегаФон (1)
  Другие (5)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen (Наумен консалтинг) (8, 246)
  ИнтелТелеком (Инфинити Трейд) (4, 161)
  Системы КлиК (ранее BMicro, БМикро) (1, 111)
  МайАстериск (myAsterisk) (1, 107)
  Avaya (36, 84)
  Другие (378, 516)

  Naumen (Наумен консалтинг) (4, 8)
  Cisco Systems (3, 6)
  Ростелеком (1, 3)
  Avaya (2, 2)
  Neuro.net (Нейро) (1, 2)
  Другие (18, 18)

  Naumen (Наумен консалтинг) (4, 17)
  Minervasoft (Пантеон Айти) (1, 4)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Zingaya (1, 2)
  Сател Про (1, 2)
  Другие (10, 11)

  Naumen (Наумен консалтинг) (5, 12)
  Группа компаний ЦРТ (Центр речевых технологий) (2, 6)
  Аргус НТЦ (1, 4)
  Mango Office (Манго Телеком) (1, 2)
  ЦРТ-инновации (1, 2)
  Другие (7, 9)

  Naumen (Наумен консалтинг) (3, 4)
  ТрансТелеКом (ТТК) (1, 1)
  Minervasoft (Пантеон Айти) (1, 1)
  Voice Systems Robotics (VSR, VS Robotics) (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (4, 4)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Naumen Contact Center (ранее IP call-центр Naumen Phone) - 221 (205, 16)
  Call Center Infinity - 163 (112, 51)
  Клиент-Коммуникатор (КлиК) - 111 (111, 0)
  CallBox Contact-center - 107 (107, 0)
  Oktell Call-center - 72 (51, 21)
  Другие 370

  Naumen Contact Center (ранее IP call-центр Naumen Phone) - 7 (5, 2)
  Cisco Unified Contact Center Enterprise (UCCE) - 4 (4, 0)
  Ростелеком: Виртуальная АТС - 3 (3, 0)
  3i TouchPoint Analytics - 2 (2, 0)
  L2U InKnowledge (KMS) - 2 (2, 0)
  Другие 17

  Naumen Contact Center (ранее IP call-центр Naumen Phone) - 12 (8, 4)
  Minerva Knowledge (ранее Minerva KMS и Naumen KMS) - 4 (4, 0)
  Naumen Erudite - 3 (3, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  VoxImplant - 2 (2, 0)
  Другие 5

  Naumen Contact Center (ранее IP call-центр Naumen Phone) - 7 (4, 3)
  SmartLogger II - 4 (4, 0)
  Аргус WFM CC (Workforce Management for Contact Сenter) - 4 (4, 0)
  Naumen Erudite - 3 (3, 0)
  Minerva Knowledge (ранее Minerva KMS и Naumen KMS) - 2 (2, 0)
  Другие 9

  Naumen Contact Center (ранее IP call-центр Naumen Phone) - 2 (2, 0)
  Аргус WFM CC (Workforce Management for Contact Сenter) - 1 (1, 0)
  SmartLogger II - 1 (1, 0)
  Mango Office Контакт-центр - 1 (1, 0)
  МТТ Голосовой бот - 1 (1, 0)
  Другие 4

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (44)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (25)
  SteadyControl (18)
  Naumen (Наумен консалтинг) (14)
  Другие (167)

  Группа компаний ЦРТ (Центр речевых технологий) (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  SteadyControl (4)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  3iTech (ранее 3i Technologies) (2)
  Другие (17)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (6)
  Naumen (Наумен консалтинг) (4)
  Другие (23)

  SteadyControl (5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Яндекс (Yandex) (2)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  Другие (11)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (17, 46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 27)
  SteadyControl HoReCa (1, 23)
  SteadyControl (1, 23)
  Другие (317, 179)

  Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
  SteadyControl HoReCa (1, 4)
  SteadyControl (1, 4)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (9, 13)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl HoReCa (1, 3)
  Voice Systems Robotics (VSR, VS Robotics) (1, 3)
  Naumen (Наумен консалтинг) (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Другие (15, 23)

  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 4)
  Яндекс (Yandex) (1, 3)
  SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
  Другие (11, 12)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  МТТ Голосовой бот - 28 (4, 24)
  SteadyControl Система контроля и управления персоналом - 23 (23, 0)
  BSS Digital2Speech - 20 (20, 0)
  Voice2Med Система распознавания речи в медицине - 14 (14, 0)
  Naumen Erudite - 12 (12, 0)
  Другие 125

  BSS Digital2Speech - 5 (5, 0)
  SteadyControl Система контроля и управления персоналом - 4 (4, 0)
  Voice2Med Система распознавания речи в медицине - 4 (4, 0)
  МТТ Голосовой бот - 2 (0, 2)
  Neuro.net Голосовой робот - 2 (2, 0)
  Другие 8

  МТТ Голосовой бот - 12 (1, 11)
  BSS Digital2Speech - 6 (6, 0)
  Naumen Erudite - 3 (3, 0)
  VS Robotics: VS Робот-оператор - 3 (3, 0)
  SteadyControl Система контроля и управления персоналом - 3 (3, 0)
  Другие -1

  МТТ Голосовой бот - 9 (0, 9)
  BSS Digital2Speech - 7 (7, 0)
  SteadyControl Система контроля и управления персоналом - 7 (7, 0)
  EXpress Защищенный корпоративный мессенджер - 6 (6, 0)
  SmartLogger II - 4 (4, 0)
  Другие 9

  SteadyControl Система контроля и управления персоналом - 5 (5, 0)
  YandexGPT (YaLM 2.0) - 3 (3, 0)
  BSS: Виртуальный голосовой ассистент - 2 (2, 0)
  BSS Digital2Speech - 2 (2, 0)
  МТТ Голосовой бот - 1 (1, 0)
  Другие 8