Владислав Беляев, AutoFAQ: Сегодня создание корпоративного цифрового помощника занимает минуты, максимум — часы
На вопросы TAdviser о применении генеративного искусственного интеллекта корпорациями и практике использования платформы AutoFAQ Xplain ответил Владислав Беляев, исполнительный директор и сооснователь AutoFAQ.
Искусственный интеллект (ИИ) уже широко применяется, последнее время стали говорить о генеративных нейросетях. Эти два понятия — «искусственный интеллект» и «генеративные нейросети» — можно употреблять как синонимы? Или между ними есть принципиальная разница?
Владислав Беляев: Генеративная нейросеть является разновидностью искусственного интеллекта. Однако, не всякий искусственный интеллект обладает способностью генерировать новый контент. Тем не менее, сегодня понятие «искусственный интеллект» для большинства пользователей, заказчиков уже подразумевает генеративность, и я полагаю, допустимо использовать эти термины как тождественные, хотя это и не совсем корректно.
Какие задачи способна решать генеративная нейросеть?
Владислав Беляев: Это разные задачи по анализу информации, формированию новых интерпретаций на основании старых понятий путем их комбинирования, варьирования. Созидание принципиально новых вещей для нее сложно, поэтому любые задачи, к решению которых она привлекается, должны быть ясны. Например, понятны такие задачи как переписать текст письма в другом стиле, сформировать новые рекламные логотипы на основании набора предыдущих логотипов.
Какие тенденции наблюдаются в применении искусственного интеллекта?
Владислав Беляев: Первый тренд — популярность генеративных нейросетей, которая связана с появлением СhatGPT — самого быстрорастущего в истории ИТ-продукта. Изначально технология была ориентирована на интернет-пользователей (B2C), в корпоративном сегменте (B2B) ждем к распространению в ближайшие два три года.
Отражением второго тренда является падение стоимости акций ряда технологических компаний в связи с тем, что экономический эффект от внедрения искусственного интеллекта оказался меньшим, чем прогнозировали аналитики. Это означает, что технология вышла на новый уровень, когда от внедрения ИИ ожидается значительная практическая польза, поэтому проектам по внедрению генеративного ИИ требуется явное экономическое обоснование.
Еще один важный тренд связан с обработкой данных. В Европе регуляторы ограничивают возможность работы с персональными данными больших провайдеров языковых моделей, уже в ходу судебные иски к этим компаниям. И есть ощущение, что дальше регулирование будет ужесточаться. Это же относится и к данным компаний, чтобы они никуда не перемещались без согласия и использовались исключительно для решения задач компании, в том числе — в рамках больших языковых моделей.
Есть ли в развитии российского ИИ-рынка специфические тенденции, принципиально отличающие его от мирового?
Владислав Беляев: Специфика у российского рынка технологий искусственного интеллекта имеется — 100%, но следует признать, что эта специфика носит общий характер, относится к любому ПО.
Россия — страна инженеров и многие проекты неизбежно будут упираться в конкуренцию с внутренней разработкой заказчика проекта, особенно при внедрениях в крупных компаниях. У них свои IT-отделы, которые зачастую уже сами что-то реализовали в этом направлении или готовы поработать самостоятельно. За рубежом ввиду более высокой конкуренции и большего объема рынка у компаний-заказчиков нет времени и ресурсов на собственные разработки в условиях, когда на рынке можно взять готовое решение.
Усиливает российскую специфику и тот факт, что российский заказчик лишился возможности приобретать ИТ-продукты многих западных поставщиков. Характерно, что российское решение может быть даже лучше зарубежных аналогов, так как наши сервисы нативно поддерживают русский язык, а для российского заказчика это важно, особенно — в плане поиска и обработки информации.
Повышенные требования по обеспечению безопасности в новых условиях, наверное, тоже добавляют специфики нашему рынку…
Владислав Беляев: Безусловно, безопасность является очень важной доминантой при создании любых ИТ-решений. В большинстве случаев (90-95%) крупные российские заказчики хотят пользоваться решением в собственном контуре безопасности. Такое требование редко встречается за рубежом, где глобальные облачные провайдеры вроде Google, Amazon, Microsoft предлагают компаниям хорошо выстроенные облачные решения. У нас есть подобные предложения на рынке от Яндекса, МТС, VK, но российские заказчики часто предпочитают решения на своей площадке, хотят обеспечивать безопасность собственными силами.
Обратимся к корпоративному контуру. Какие задачи можно возложить на корпоративного ассистента, созданного на базе технологий искусственного интеллекта? Сколько времени уходит на его создание?
Владислав Беляев: Традиционно цифровой ассистент или чат-бот на базе искусственного интеллекта создавался с тем, чтобы он мог выполнять определенный набор функций с целью решения нескольких задач, заданных разработчиком. Благодаря генеративному ИИ сегодня можно создавать цифровых помощников теоретически с неограниченными возможностями, количество задач диктуется лишь соображениями целесообразности.
Например, можно быстро сделать многофункционального ИИ-ассистента, который отвечает на вопросы по персоналу, управлению закупками, финансами, клиентскому сервису, технической поддержке и многим другим. Раньше его разработка требовала много труда, занимала дни, недели, а то и месяцы. Сегодня создание корпоративного цифрового помощника занимает минуты, максимум — часы. Достаточно подключить источники данных, и ассистент сможет предоставлять сотрудникам ответы на вопросы по этим данным. Ключевая задача сейчас для искусственного интеллекта — это консультация сотрудников, помощь ему в плане ориентации в гигантском объеме информации, который имеется в каждой крупной компании.
Отмечу еще, что интерпретировать информацию цифровой ассистент способен под конкретного человека, с учетом его возраста, социального положения, образования. Например, формальный ответ на вопрос пожилого человека, желающего узнать решение своей юридической проблемы, ничего ему не даст. Порой даже юристу бывает сложно разобраться в тонкостях формально грамотного ответа. Ассистент способен превратить формально верный, но сложный для понимания ответ, в понятный, причем без участия человека, — в этом и есть момент интеллектуальности. Цифровой помощник способен самостоятельно интерпретировать текст в соответствии с поставленной задачей.
Перейдем к платформе AutoFAQ Xplain. Как выглядит этот продукт с точки зрения пользователя?
Владислав Беляев: Это канал коммуникации сотрудника с цифровым ассистентом, реализованный, например, посредством публичного или корпоративного мессенджера, электронной почты, корпоративного портала, социальной сети. Возможна интеграция и с телефонией.
Расскажите о конкретных кейсах, реализованных на основе этого продукта.
Владислав Беляев: Наш продукт ориентирован в первую очередь на решение задач корпоративного поиска, то есть на анализ огромных объемов информации и их интерпретации. Основная цель: помочь сотруднику найти правильное решение проблемы, объяснить пользователю понятным языком ее суть, поэтому в название продукта и добавлено Xplain, образованное от explain («объяснять»).
Из кейсов: в нескольких крупных компаниях (телеком-оператор, энергетический провайдер, производственная компания) мы реализовали поддержку клиентского сервиса на базе нашего продукта. Это работа с клиентскими обращениями. Система помогает операторам контактного центра быстрее сориентироваться в проблеме, меньше ошибаться, быстрее находить необходимую для ответа информацию, а не дает прямые ответы непосредственно клиентам. Тем самым обеспечивается более качественный сервис.
Где еще применяется технология AutoFAQ Xplain на практике?
Владислав Беляев: Еще одно применение нашей технологии — помощь сотрудникам крупной компании, свыше 10 тыс. человек. В таких больших структурах есть регламентированные бизнес-процессы, процедуры, положения, приказы и так далее. Сориентироваться в этом сложно любому сотруднику, даже опытному, не говоря уже о новичках. Наша система делает внутренние нормативные документы доступными для понимания людей. Сотрудник может задать ИИ-ассистенту вопрос и получить ответ с решением его проблемы. Таким образом, мы делаем информацию внутри компании доступной для того, чтобы ей можно было легко воспользоваться.
На какой размер бизнеса ориентирована компания? Сколько клиентов на сегодня?
Владислав Беляев: В основном работаем с крупным корпоративным бизнесом — это производственные компании, банки, телеком-операторы, ритейлеры. На сегодня у нас порядка 50-ти компаний-клиентов.
Сколько специалистов в команде?
Владислав Беляев: 25 человек.
Справляетесь? Все-таки 50 крупных клиентов…
Владислав Беляев: Справляемся, ведь мы сделали продукт таким, чтобы заказчики могли пользоваться им без нашего участия. Это конструктор, с помощью которого можно самостоятельно собрать решение под свою задачу и управлять им без привлечения вендора. В этом конкурентное преимущество платформы AutoFAQ Xplain.
Какие еще имеются у AutoFAQ Xplain выгодно отличающие особенности?
Владислав Беляев: Особенность нашего решения в том, что это не просто некий «черный ящик», в котором происходит что-то непонятное, — нейросетью можно управлять. Система гибкая, ее можно настроить и даже скорректировать ответ. И это очень существенная возможность, из-за которой многие заказчики с нами работают. Система способна запомнить скорректированный ответ и в дальнейшем предоставить его, работая в гибридном режиме с генеративной моделью, и из-за этой особенности один из клиентов предпочел наше решение бесплатной системе. Люди не целиком доверяют искусственному интеллекту, а наше решение позволяет повысить уровень доверия и управляемости.
Преимущество нашей платформы еще и в стоимости реализации проектов, и, соответственно, в большей экономической обоснованности проекта внедрения генеративной нейросети. Например, в нашем портфеле есть кейс, когда благодаря архитектуре платформы одну из доработок на этапе внедрения у Заказчика мы реализовали в 35 раз дешевле, чем у альтернативного крупного поставщика.
На какой бизнес-эффект можно рассчитывать от внедрения цифровых помощников в процессы предприятия? Как оценить этот эффект?
Владислав Беляев: Эффект заключается не только в сэкономленном времени, но и в новых продуктах, которые становятся возможны благодаря внедрению новой технологии. Согласно исследованиям McKinsey, когда компании только начинают внедрять искусственный интеллект, они нацелены больше на сокращение затрат, материальных и временных. Но когда систему внедрили, активно ей пользуются, то начинают думать о возможности заработать.
Соответственно, при первоначальной оценке экономического эффекта от внедрения системы на генеративном ИИ речь идет, как правило, об экономии времени. Например, сотрудники компании тратят некоторое количество минут в день на поиск информации. И если ускорить процессы поиска, предположим, на 15 минут для каждого сотрудника, то эффект будет не в сокращении материальных затрат, а в том, что компания, в которой время сотрудников высвободилось на нечто более полезное, чем поиск информации, сможет больше заработать.
Важную роль играет именно качественный подход, когда руководство компании понимает, что использование инструментов, основанных на ИИ, даст переход на новую парадигму работы сотрудников внутри компании, основанную на более высоких скоростях поиска необходимой информации.
А возможно ли количественно оценить экономический эффект от внедрения ИИ-ассистента?
Владислав Беляев: Согласно нашим исследованиям в результате внедрения нашей системы рост выручки компании может составить до 6%. Например, мы говорим потенциальным заказчикам, что помогаем сэкономить порядка 4 млн. рублей на каждые десять сотрудников службы поддержки, которые пользуются сервисом.
Как получилась эта сумма?
Владислав Беляев: Расчет этой суммы основан на зарплате одного человека. Мы исходим из того, что помогаем автоматизировать работу сотрудника на 40-60%, а затраты на человека порядка 50-100 тыс. руб. в месяц. Это и дает в год около 4 млн. руб. на каждые десять сотрудников.
Но, повторюсь, ключевой эффект носит качественный характер, и связан с другими скоростями поиска необходимой информации. В свое время, на заре Рунета были сайты-поисковики, которые предлагали для поиска рубрикатор, а не одну строчку. Как мы знаем, победили поисковики, максимально упростившие задачу поиска информации для пользователя, при помощи одной строки для запроса. Нечто схожее предлагаем компаниям и мы. Имеется большое количество баз знаний, в которых сложно найти нужную информацию, а при помощи нашего решения сотрудники способны в этой информации также просто ориентироваться, как при помощи того же Яндекса или Google.
Почему требуется соблюдать конфиденциальность при использовании ИИ-ассистента, разграничивать доступ сотрудников к информации?
Владислав Беляев: В качестве примера приведу реальное техническое задание от крупной производственной компании-заказчика, где работает СЭД, в которой реализованы правила разграничения прав доступа. Необходимо было обеспечить, чтобы интеллектуальный ассистент поддерживал правила. Это никак не связано с математической моделью, реализованной внутри ИИ-ассистента и качеством его работы. Это техническое требование по разграничению доступа к информации, которая для ряда пользователей составляет коммерческую или промышленную тайну.
Чтобы решить эту задачу, мы на уровне платформы обеспечиваем проверку прав пользователя на получение информации по запросу. И при формировании ответа система использует только те документы, к которым пользователю разрешен доступ. Например, если речь идет о положении по командировкам, то, скорее всего, оно доступно для любого сотрудника. На доступ к финансовым, закупочным документам, условиям договоров с конкретными заказчиками, как правило, есть ограничения. Право доступа к ним имеют службы внутреннего контроля, финансовый департамент, те пользователи, кто управляет договорами, им ИИ-ассистент и выдает такую информацию.
В чем специфика подключения цифровых помощников к корпоративным базам знаний, каналам коммуникации?
Владислав Беляев: Это инженерная задача, в ней нет ничего сложного. Источниками данных могут быть корпоративные решения, такие как Confluence, Minerva, SimpleOne, СЭД или внутренние регламенты в виде сотен документов, размещенных в каталогах. Задача подключения к источникам данных сводится к тому, чтобы Xplain эту информацию определенным образом структурировал, загружал, превращал в понятный для генеративной сети формат.
В составе платформы есть специальное хранилище данных, где аккумулируется вся информация из разных источников данных?
Владислав Беляев: Хранилища оригинальных данных в системе нет, но имеется хранилище преобразованных или т. н. «векторизованных» данных. Из них невозможно восстановить исходную информацию, но они позволяют осуществлять быстрый поиск. По сути, мы индексируем всю информацию, и храним индекс у себя в векторной форме. И у нас есть компонента в системе, отслеживающая изменения данных в разных источниках знаний, которые регулярно индексируются заново с формированием новых векторизованных данных с целью обеспечения высокой скорости ответа корпоративного ИИ-консультанта.
Есть ли ограничения по объему данных, загружаемых для работы ИИ-помощника?
Владислав Беляев: В архитектуре AutoFAQ Xplain таких ограничений нет, поскольку сначала мы проводим индексацию данных, и лишь потом осуществляем поиск и генерацию ответа. Конечно, у заказчиков бывают сотни тысяч документов, но мы способны поддерживать работу и с такой большой базой знаний при наличии оборудования определенного уровня. Следует понимать только, что это означает повышенные требования к бюджету проекта.
В чем недостатки использования общедоступных генеративных нейросетей для решения задач корпораций и госорганизаций?
Владислав Беляев: Основной недостаток использования зарубежных генеративных нейросетей в том, что это нарушение российского законодательства, поскольку осуществляется передача данных за рубеж.
Что касается крупных систем российского производства, то они ориентированы в первую очередь на работу с розничным сегментом (B2C), c малым бизнесом или конечными пользователями. С большой вероятностью можно утверждать, что общедоступное решение на базе генеративных нейросетей не может быть поставлено в контур безопасности компании, поскольку оно спроектировано под другие задачи.
Еще один недостаток заключается в том, что общедоступные генеративные сети не работают с массивами данных компании. Можно отправить файл или несколько файлов, какую-нибудь картинку, но загрузить несколько тысяч документов в автоматическом режиме из внешних источников данных вряд ли возможно, для этого не предусмотрено соответствующего интерфейса.
Математические модели, заложенные в AutoFAQ Xplain, собственной разработки?
Владислав Беляев: Мы либо используем готовые математические модели на базе Open Source, либо дорабатываем, улучшаем их под задачи конкретного заказчика. Создание и тренировка собственной генеративной сети на моделях своей разработки — очень сложная задача, требующая больших инвестиций. Чтобы адаптировать готовую модель, нужно гораздо меньше ресурсов, при этом важно правильно их подобрать и настроить под задачи клиента.
С клиентами работаете напрямую или через партнерскую сеть? Сколько времени занимает внедрение?
Владислав Беляев: С клиентами мы работаем и напрямую, и через партнеров. В нашу партнерскую сеть входят несколько крупных интеграторов, которые являются нашими дистрибьютерами. Сам процесс внедрения не занимает много времени, обычно проект продлится от нескольких дней до нескольких недель, но в некоторых случаях перевод системы в промышленную эксплуатацию может занять несколько месяцев при развертывании в контуре безопасности Заказчика.
Планы компании по развитию платформы?
Владислав Беляев: Мы получили большое количество запросов с рынка и поняли, что нужно выпустить некоторые модули конкретно под задачи заказчиков. Один из модулей AutoFAQ будет предназначен для работы с табличными данными, другой — для помощи в продажах, например, финансовых продуктов и сервисов. Кроме того, будем развивать подключение к различным источникам данных, хотим построить универсальную шину, которая позволит быстро адаптироваться под конкретного заказчика, его набор источников данных.