2024/07/17 12:59:24

Александр Крушинский, BSS: Нейросети заменят операторов контакт-центров, и от этого выиграют все

Контакт-центры активно применяют голосовых помощников, чат-ботов и речевую аналитику. Несмотря на неоднозначное отношение клиентов, технологии на основе ИИ используются все активнее. В чем секрет их успеха и чего ждать в будущем, рассказал Александр Крушинский, директор департамента речевых технологий BSS.

Александр
Крушинский
80-90% крупных контакт-центров уже используют голосовых ассистентов и чат-ботов. Прогресс, подкрепленный явной экономией, не остановить.

Контакт-центры стали локомотивом внедрения ИИ. Чем это обусловлено?

Александр Крушинский: Бизнес контакт-центра — это прием телефонных звонков или текстовых обращений на естественном языке и ответ на эти обращения на таком же естественном языке. Автоматизировать эту деятельность без технологий обработки естественной речи невозможно. А в основе этих технологий лежит как раз ИИ. Точнее, нейросети, которые в обиходе называют искусственным интеллектом.

Обработка естественной речи — это одна из основных областей применения нейросетей, наряду с обработкой изображений и принятием решений. Так что не удивительно, что контакт-центры стали активно извлекать из них выгоду. 90% проектов, которые мы реализуем по внедрению речевых технологий — чат-ботов, голосовых помощников, речевой аналитики, автоматизации исходящих обзвонов относятся именно к контакт-центрам.

Какие именно технологии используют контакт-центры?

Александр Крушинский: Есть целый набор: распознавание устной речи и перевод ее в текст, извлечение смысла, сказанного из текстовой расшифровки, синтез голоса, глубокий анализ диалогов и поиск общих трендов, инсайтов. На основе этих технологий контакт-центры используют голосовых помощников и чат-ботов, роботов-суфлеров, инструменты речевой аналитики и голосовую биометрию.

Мы, в типовом проекте автоматизации контакт-центра используем, как минимум: ASR (распознавание устной речи), TTS (синтез речи), IR (intent recognition, для распознавания смысла реплик), NER (named entity recognition для извлечения смысловых атрибутов из реплик). Помимо этого базового набора, есть отдельные решения для специфических задач: анализа эмоций, суммаризации диалогов, кластеризации, LLM для генерации уникальных ответов, RAG для комбинирования информации из разных источников, чтобы оперативно получать наиболее полные и информативные ответы и т.д.

Какие отрасли особенно выигрывают от внедрения таких решений?

Александр Крушинский: Как таковой отраслевой специфики нет. Решения востребованы там, где есть большие контакт-центры, массовое обслуживание клиентов. Это банки, телеком, МФЦ, медицина, страхование и другие отрасли. Везде, где есть большой объем клиентских запросов, нейросети могут принести ощутимую пользу: автоматизировать ответы на типовые вопросы на входящих линиях — по телефону или в чатах, упростить исходящий маркетинг — когда робот предлагает услуги от лица компании, а также анализировать диалоги между клиентами и живыми операторами, чтобы проверять качество работы и выдавать рекомендации, как эту работу улучшить.

Для каждой отрасли есть своя специфика, и для основных отраслей мы предлагаем не только базовые технологии и инструменты, но и так называемые отраслевые пакеты, которые включают в себя готовые модели распознавания, адаптированные под специфическую лексику домена, и типовые шаблоны сценариев. У нас есть специализированные решения для госсектора, банковской сферы, медицины, страховых компаний, управляющих и ресурсоснабжающих организаций в ЖКХ, транспорта и др.

Какие из перечисленных технологий уже активно используются, а какие пока редкость?

Александр Крушинский: Чаще всего используют голосовых ассистентов и чат-ботов. По моим наблюдениям, они есть в 30-50% компаний, которые активно ведут диалог с клиентом в текстовом или голосовом канале. В компаниях с крупными контакт-центрами проникновение технологии еще выше — где-то 80-90%. Они могут находиться в разной степени зрелости: где-то робот может поддержать разговор на любую тему, где-то ограничен несколькими тематиками, но в той или иной степени они внедрены более чем в половине организаций.

На втором месте находятся системы речевой аналитики. Их используют порядка 10% всех компаний с активным клиентским общением и 50% компаний с крупными контакт-центрами. Плюс технология начинает выходить за пределы контакт-центров. С ее помощью можно анализировать диалоги в офисах, точках продаж, отделениях банка. Правда, тут уже речь идет о микрофонной аналитике, а с ней сложнее. Нужно установить сами микрофоны, настроить их на отсечку фоновых шумов, адаптировать языковые модели на распознавание речи. Это довольно сложно, но мы умеем это делать. У нас реализованы такие проекты с хорошими результатами. Главное, интерес к технологии есть: компании хотят контролировать абсолютно серую зону общения продавцов с клиентами в точках обслуживания.

Голосовая биометрия, при помощи которой идентифицируют клиентов, — многим известная технология, но распространена пока мало. Ее сложно внедрять из-за требований законодательства по защите персональных данных и голосовых слепков в частности.

Если говорить о нашем опыте, то чаще всего мы внедряем голосовых помощников — примерно в 50% проектах. Далее идет речевая аналитика — в 30% проектах, чат-боты — 15% и автоматизация исходящей линии — 5%

Как измеряется эффективность внедрения нейросетей в контакт-центрах?

Александр Крушинский: Финансовую выгоду от внедрения чат-ботов и голосовых ассистентов посчитать проще всего. Допустим, в контакт-центре работает 100 операторов. Это, кстати, не крупный контакт-центр, у наших заказчиков есть контакт-центры на тысячу и даже несколько тысяч операторов. Но возьмем 100. Один оператор стоит 800 000 рублей в год — с учетом зарплаты, налогов, накладных расходов и т.д. 100 человек — это 80 млн. руб в год. Робот снимает от 20 до 70% нагрузки с контакт-центра. 20-30% — это минимальный результат на наших проектах. Соответственно, это 16-24 млн руб в год экономии. Расчет очень легкий, такие проекты легче всего обосновать и с них обычно и начинают автоматизацию КЦ.

Речевая аналитика — очень полезная технология. Анализируя разговоры операторов с клиентами, можно найти способы улучшить клиентский сервис, повысить продажи, снизить отток клиентов. Руководство получает инсайты, благодаря которым меняются не просто процессы обслуживания в контакт-центре, а бизнес-процессы в целом. Например, с помощью речевой аналитики можно понять, что клиенты жалуются на сайт компании. Не понимают, как оплатить покупку, бросают товар в корзине. Тогда нужно не по телефону им четче объяснять алгоритм, а доработать сайт. Это принесет гораздо большую выгоду компании. Но посчитать экономическую модель в таких проектах сложно — она базируется на ряде допущений.

Давайте поговорим об LLM-технологиях. Насколько они сейчас применимы в реальном бизнесе и каковы их перспективы?

Александр Крушинский: Большие языковые модели (LLM) начали активно применять в конце 2022 года, когда появился ChatGPT. Их можно использовать и в чат-ботах, и в голосовых ассистентах, и в речевой аналитике. У LLM уже видны проблески настоящего искусственного интеллекта, они научились проходить тест Тьюринга, и их потенциал огромен. Сейчас практических применений у этих моделей не так уж много, технология слишком свежая. Увидеть результаты их применения в реальном бизнесе нам только предстоит, но, я надеюсь, уже в самое ближайшее время.

Вообще эта область (LLM) развивается очень быстро: таких темпов развития какой-либо технологии мы, возможно, не наблюдали никогда. Мы сейчас вкладываем значительные усилия, чтобы оставаться на переднем крае технологий, непрерывно тестировать новые версии LLM-моделей и обновлять наши решения в этой части (обновления в части LLM мы выпускаем сейчас примерно каждые два месяца).

Кроме того, чтобы обновлять технологии в том темпе, как они появляются, мы продолжаем искать способы практического применения LLM. И эта задача не так проста, как может показаться на первый взгляд. Во-первых, технология новая, и ее внедрение в рабочие решения создает абсолютно новый опыт, реальную применимость которого только предстоит доказать. Помимо очевидных кейсов типа внедрения LLM для генерации персонифицированных ответов клиентам, есть более специфические варианты использования. Например, выдача операторам персональных рекомендаций по ведению диалогов. Но даже для очевидных кейсов (как упомянутые GPT-боты) есть целый ряд ограничений, которые необходимо преодолеть для использования в Enterprise сегменте.

Тем не менее, мы уже сейчас расширили возможности речевой аналитики с помощью GPT-анализа. Реализовали поддержку нейросети GPT в чат-боте для бизнеса ПСБ. А вместе с нашим партнером компанией L2U в их базе знаний InKnowledge, которая встроена в единый технологический стек нашей омниканальной диалоговой платформы Digital2Speech, используем интеллектуальный поиск на базе нейросети GPT и технологии RAG. Это помогает задавать вопросы и получать ответы на естественном языке, что значительно упрощает взаимодействие с базой знаний.

Стоит ли бояться ИИ? Еще в 2019 была громкая история, когда чат-бот одного из банков посоветовал клиентке отрезать палец, чтобы зайти в приложение.

Александр Крушинский: Думаю, это была утка, запущенная самим банком. На каких данных его обучали, что в итоге появился такой совет? Технологий, подобных ChatGPT, тогда еще не существовало. Сами научили? Сомневаюсь. Скорее всего, пиарщики придумали эту историю, чтобы хайпануть.

Но если серьезно, проблема неконтролируемого черного ящика в ИИ была и остается основным ограничителем по его использованию. Генеративные сети, подобные ChatGPT, развиваются так стремительно, как ни одна другая технология. И их, действительно, трудно контролировать, ведь они отвечают не заготовками, а генерируют текст на ходу. С другой стороны, их можно обучать, и они слушаются. Если написать промт, что нельзя оскорблять человека, бот не будет этого делать. Если сказать, что бот не должен отвечать, если ответа нет в корпоративной базе знаний, бот не станет выдумывать ответ.

Результаты экспериментов, и наши в том числе, показывают, что самообучающихся роботов уже можно применять на практике под контролем оператора. В течение нескольких лет они прочно займут свое место и в контакт-центрах, и в других сферах.

Многих клиентов чат-боты и голосовые помощники раздражают. Но контакт-центры продолжают их использовать. В чем секрет?

Александр Крушинский: Во-первых, прогресс, подкрепленный явной экономией, не остановить. А во-вторых, мы постоянно мониторим работу наших ботов, и я бы не сказал, что роботы бесят большинство клиентов. Если говорить о массовых прозвонах, то тут дело не в ботах — живой человек с навязчивым предложением раздражает точно также.

Если же посмотреть на входящие звонки, то тут у звонящего варианта два: ждать ответа оператора минут по 20 или получить мгновенный ответ от бота. Да, боты сейчас не всегда понимают сказанное и иногда отвечают невпопад. Зато порой ведут себя более адекватно, чем операторы, так как не устают, не злятся и не отвлекаются. Как правило, роботы интегрированы с внутренними учетными системами заказчика и имеют мгновенный доступ к любой информации, поэтому отвечают быстрее и точнее, чем операторы. Особенно начинающие операторы, а ведь в контакт-центрах огромная текучка.

Еще интересный момент: люди приспосабливаются к роботу и добиваются результата быстрее. Например, человек хочет записаться к врачу. Он звонит в клинику и начинает объяснять проблему. Здоровается, описывает симптомы, порой с излишними подробностями, и только в конце формулирует просьбу, часто в неявной форме. Бот из насыщенного деталями обращения не может понять, что от него требуется. Но пообщавшись с ботом пару раз, люди начинают формулировать запрос коротко и четко: «Записаться к врачу!», «да», «нет», «подтверждаю». В итоге записываются быстрее, чем если бы дозванивались до живого человека.

Роботы приспосабливаются к людям, а люди приспосабливаются к роботам. В будущем работу операторов контакт-центров роботы точно будут делать лучше живых людей и заменят их.

То есть роботы все-таки отнимут у людей работу?

Александр Крушинский: Разговоры о том, что технологии заменят людей, ведутся с начала XIX века. И что-то не видно на обочинах дорог толп крестьян, которым нечем заняться! Наоборот, сейчас в сельском хозяйстве 90% персонала — офисные сотрудники. Они занимаются логистикой, обслуживанием техники, продажами, а не выкапыванием картошки или поливом огурцов.

Наши клиенты, внедряя роботов, не увольняют половину людей. Они сокращают ожидание до нуля и перекидывают операторов на сложные вопросы. Фокусируются на качестве обслуживания, а не экономии.

Кроме того, сама технология порождает новые рабочие места. Появилась профессия «скрипт-дизайнер» — это человек, который разрабатывает для ботов алгоритмы общения. Data Scientist — это целая совокупность профессий на стыке машинного обучения, статистики и программирования.

Уверен, в глобальном смысле нам ничто не угрожает.

Что сдерживает внедрение ИИ-технологий?

Александр Крушинский: Во-первых, недоверие. Технология появилась недавно и развивается слишком стремительно. Мы не успеваем привыкнуть к одному, а уже появляется другое. Наши заказчики порой не понимают, какие должны быть критерии выбора, что писать в ТЗ, какого эффекта ожидать. Чтобы им помочь, мы делаем отраслевые решения. Роботы знают популярные в отрасли тематики, частые вопросы, есть готовые сценарии диалогов. Адаптировать решение под себя проще, чем работать с голой технологией.

Во-вторых, внедрение ИИ-технологий требует от заказчиков компетенций, которых у них нет. Скрипт-дизайнеры, дата-сайентисты — это новые профессии, таких людей на рынке не так много и стоят они недешево. Чтобы преодолеть эту преграду, мы предоставляем услуги консалтинга, обслуживая робота «под ключ». Хотя лучше, когда заказчик развивает своего бота сам, зная все детали своего бизнеса и оперативно внося изменения. Чтобы облегчить ему задачу, мы много вкладываем в инструментарии, делаем визуальный интерфейс, понятные алгоритмы. Пройдя небольшой видеокурс, составлять диалоги для бота могут даже не технические специалисты.

В-третьих, внедрение ИИ сдерживает необходимость использования графических процессоров. Нейросети очень требовательны к серверным мощностям, им в идеале нужны GPU, которых по умолчанию в контакт-центрах нет. Стоят такие компьютеры дороже игровых — от 1 млн рублей за штуку, плюс обслуживание. Мы адаптируем технологии под стандартное железо с CPU, но это возможно не везде.

Есть ли у вас интересные истории о внедрении нейросетей в контакт-центрах?

Александр Крушинский: Историй у меня полно! Любимая такая: во время самых жестких коронавирусных ограничений, когда нельзя было выходить из дома без специального кода, каждый город решал проблему по-своему. В Москве код можно было получить даже по смс. А вот в Нижнем Новгороде был только сайт и мобильное приложение. Сотрудникам МФЦ стало ясно, что многие люди, особенно пожилые, ни с каким мобильным приложением не справятся, и на них обрушится шквал звонков. Ожидалось, что нагрузка вырастет с 50 до 300 одновременных диалогов. Привлекли волонтеров, но удалось найти только 20 человек: вместо 40 сотрудников стало 60, но нужно-то 300! Мне позвонили в воскресенье утром, выдернули с дачи и попросили срочно внедрить чат-бота, который будет обрабатывать звонки и выдавать пропуска. И сделать это нужно было к понедельнику, когда вводились новые правила самоизоляции.

Мы собрали команду, работали в две смены по 12 часов, буквально: один ложится — другой встает, и в понедельник днем сделали тестового робота. Во вторник уже ввели его в эксплуатацию. Несколько недель он успешно выдавал людям пропуска, обрабатывая по 300 звонков одновременно.

Я бы не хотел работать в таком авральном режиме всегда, но в целом эта история про то, что новая технология — это не всегда долго и сложно: от первого запроса в виде пары фраз до реальной пользы целому городу прошло всего два дня.

Можно ли сказать, что нейросети эффективны при большом потоке типовых запросов? Если каждый запрос уникален, работу не автоматизировать?

Александр Крушинский: Если звонков много, их всегда можно разделить на группы и хотя бы часть передать роботам. При звонке в поликлинику 50-70% звонков — это всего две тематики: запись к врачу и вызов врача на дом. Сценарии ответа понятны и снимут минимум половину трафика.

В банке может быть 1000 тематик, но есть несколько десятков, которые можно автоматизировать и которые закроют 20% обращений. Это расчет для одного из наших крупных клиентов — банка из ТОП-10. А 20% обращений в контакт-центр с сотнями сотрудников — это большая экономия.

Если у нас есть готовое отраслевое решение, мы уже знаем, какие типовые вопросы можно передать роботу. Если тема новая, мы проводим обследование. Буквально: садимся с заказчиком и слушаем звонки, выбираем типовые вопросы, решаем, что автоматизировать. Это всегда вопрос на стыке частотности и простоты.

Расскажите про робота-суфлера. В чем его ценность для контакт-центров?

Александр Крушинский: Суфлер — это помощник оператора. Он не разговаривает с клиентом, а дает оператору подсказки. В голосовом варианте это скорее концепция. В реальной жизни человеку очень сложно одновременно и разговаривать с клиентом, и читать с листа подсказки. Я лично пробовал. А вот в текстовом варианте проще: оператор общается в мессенджере, суфлер присылает ему подсказки. Такие схемы уже активно применяются. В том числе используются генеративные нейросети: робот дает пример ответа, оператор его либо подтверждает и высылает клиенту, либо редактирует, пишет свой вариант.

Сценариев использования робота-суфлера несколько. Во-первых, он может следить за разговором и давать подсказки лишь в некоторые моменты. Например, когда появился удачный момент предложить дополнительную услугу. Во-вторых, он может отслеживать какие-то угрожающие ситуации и сигнализировать, что нужно подключить старшего специалиста. Ну и в-третьих, суфлер может помогать оператору не искать информацию в базе знаний, а сразу выводить подходящие темы, как только оператор нажал на поиск в окне своего АРМ.

Несмотря на то, что нейросети развиваются быстрее, чем мы успеваем за ними следить, можете вы все-таки дать какие-то прогнозы? Что ждет нас в будущем?

Александр Крушинский: Нейротехнологии и правда развиваются стремительно. Если даже до сильного искусственного интеллекта не дойдет, и технология резко остановится на текущем уровне, у нас будет запас в несколько лет по ее практическому применению. Будут создаваться отраслевые решения, прикладные инструменты, интеграции с другими информационными системами.

Если же технологии будут развиваться дальше — а все к этому идет — мы в пределах нескольких лет выйдем на сильный искусственный интеллект, который повлияет не только на контакт-центры, но и на всю нашу бытовую жизнь. На более короткой дистанции, до года, роботы будут становиться умнее, научатся отвечать на несколько вопросов, заданных в одном предложении, смогут следить за отклонением от темы и потом возвращаться к изначальному вопросу. Станут более эмпатичными.

Думаю, роботы будут все больше и больше приближаться к человеку и уже в контакт-центрах превзойдут среднего оператора как в интеллектуальности, так и в душевности. Причем будут не просто деликатными собеседниками, но и способными адаптироваться под стиль общения собеседника, его пол, возраст, другие особенности. И, вполне вероятно, роботы будут проактивны, смогут предлагать решение проблемы до того, как ее озвучили.