2025/12/30 11:31:58

Юрий Карев, ВТБ: Цифровые советники — наш следующий шаг в развитии ИИ

Банк ВТБ выстроил системную работу с искусственным интеллектом — от классических скоринговых моделей до генеративных решений и цифровых советников. О том, как ИИ интегрирован в производственные процессы, зачем банку собственная MLOps-платформа, почему важна зрелость заказчика и что станет следующим этапом развития — рассказывает Юрий Карев, начальник управления процессов ML департамента анализа данных и моделирования ВТБ. Интервью проводилось в рамках исследовательского проекта TAdviser и Rubytech «Как корпорации и госструктуры внедряют ИИ».

Юрий
Карев
Критической нехватки оборудования для ИИ на текущий момент нет. Мы обеспечены вычислительными мощностями, хотя масштабироваться, конечно, сложно.

Юрий, какую роль искусственный интеллект сегодня играет в ВТБ и какие технологии используются?

Юрий Карев: Сегодня искусственным интеллектом называют разное — вплоть до чат-ботов, работающих по правилам и имитирующих человеческое общение. Но в профессиональной среде мы говорим прежде всего о технологиях машинного обучения. В ВТБ используется три основных блока:

1. Традиционное машинное обучение, которое применяется в банковской аналитике уже свыше 20 лет для построения скоринговых моделей, прогнозирования, регрессий, деревьев решений, бустинга. Эти инструменты лежат в основе кредитных и риск-моделей, обеспечивают оценку финансовой надежности клиентов, определяют лимиты и пороги риска.

2. Технологии анализа неструктурированных данных: распознавание текстов, изображений, голоса, извлечение смыслов и тональности. Они применяются при обработке обращений клиентов, работе колл-центра, анализе документов, классификации обращений.

3. Генеративные решения, включая LLM и NLP, которые мы используем в пилотных сервисах — от интеллектуальных помощников до внутренних систем поиска и навигации по корпоративным базам знаний.

Искусственный интеллект для нас — это не отдельная технология, а инструмент, встроенный в производственные процессы и повышающий эффективность самых разных направлений бизнеса.

Каким образом выстроен процесс создания и сопровождения ИИ-решений? Используете ли вы какую-либо open source или проприетарную MLOps-платформу?

Юрий Карев: У нас есть собственная MLOps-платформа. Мы начали ее создавать еще в 2019 году, когда формировали централизованное подразделение анализа данных. Платформа выросла из необходимости встроить работу дата-сайентистов в производственный процесс — на стыке бизнеса и IT, где бизнес-задачи превращаются в эксперименты с данными, проверку гипотез, новые модели.

В банковской сфере есть критически важный аспект — модельный риск, разновидность операционного риска, который строго регулируется ЦБ. Чтобы системно работать с ним и аккумулировать всю необходимую информацию, мы с нуля создали собственную систему Управления моделями. Это не просто реестр, а сквозная система, которая сопровождает модель от идеи до внедрения и дальнейшей эксплуатации. Каждый артефакт — гипотеза, описание витрины, алгоритм, выборка, отчет — фиксируется и хранится. Все модели имеют идентификаторы и управляются в соответствии с требованиями ЦБ.

Поверх этого работает MLOps-конвейер — конвейер CI/CD, обеспечивающий тестирование и доставку моделей в продакшен. Он учитывает банковскую специфику, например, строгое разделение контуров разработки и промышленных данных, что является требованием регулятора. Мы используем весь необходимый инструментарий: MLflow, контейнеризацию и так далее.

Так что наша платформа — это не что-то «допиленное», а целостная экосистема для управления жизненным циклом AI-моделей.

В каких направлениях бизнеса ИИ уже применяется на практике?

Юрий Карев: Наиболее зрелые направления — это управление рисками, особенно кредитными в рознице и малом бизнесе, и CRM: прогнозирование оттока клиентов, персональные предложения, оптимизация коммуникаций. Спрос на аналитические модели там всегда высокий.

Широко применяется распознавание документов. Это не только сортировка входящих писем по подразделениям, но и, например, распознавание сложной финансовой отчетности компаний для кредитного процесса. Модель способна «прочитать» сотни страниц отчетности, извлечь ключевые показатели и сверить их с базой — это экономит огромные ресурсы в кредитных процессах.

Есть и более специализированные кейсы. Наша геоплатформа, например, помогает оптимизировать сеть банкоматов, прогнозируя локации и логистику их обслуживания. Другой крупный проект — оценка стоимости недвижимости для льготной ипотеки. Мы научились предсказывать стоимость квадратного метра по локации, используя размеченные атрибутивные карты городов. Это помогает специалистам по управлению рисками и бизнесу согласовать оценку при финансировании застройщиков.

Более свежие, но уже работающие в продуктиве технологии — в колл-центре: анализ тональности разговоров, эффективности операторов, распознавание речи и эмоций.

А какие проекты пока находятся в стадии тестирования?

Юрий Карев: В пилотном режиме сейчас тестируются большие языковые модели (LLM). Мы установили внутреннюю модель — вначале просто как демонстрационный инструмент, чтобы сотрудники могли понять ее возможности. Сейчас на ее основе готовим внутренние сервисы: например, «умную бизнес-вики», которая отвечает на вопросы по нормативным документам и внутренним базам знаний. Вывод таких решений во внешний контур потребует более серьезной защиты и контроля качества контента. Мы работаем над тем, чтобы исключить некорректные или репутационно чувствительные ответы.

Следующий этап — мультиагентные системы: когда бизнес-аналитик сможет собрать решение из нескольких «атомарных» моделей — например, одна распознает текст обращения, вторая определяет его суть, третья ищет ответ в нормативной базе. Это уже зачатки цифровых помощников, и именно они — наш ближайший вызов.

Как корпорации и госструктуры внедряют ИИ. Результаты исследования TAdviser при участии Группы Rubytech

Кто в ВТБ обычно инициирует такие проекты: бизнес или IT?

Юрий Карев: Заказчиком всегда выступает бизнес, потому что ключевой критерий — экономический эффект. Но продвигает и фасилитирует инициативы часто IT, в частности наше подразделение анализа данных и моделирования. Мы помогаем бизнесу сформулировать задачу, оценить потенциал, подготовить данные и довести проект до внедрения.

Есть ли в банке централизованная стратегия развития ИИ?

Юрий Карев: Да, и она многоуровневая. Внутри банка работают две программы:

1. «Лаборатория продвинутой аналитики» — объединяет все инициативы, связанные с применением машинного обучения.

2. «Цифровой помощник» — программа, нацеленная на развитие LLM и агентных решений.

Обе программы утверждаются на три года и вписаны в общую стратегию цифрового развития банка, синхронизированную с государственной программой цифровой трансформации. В документах Минцифры уже есть разделы, посвященные развитию искусственного интеллекта и метрикам эффективности — мы работаем в полном соответствии с этими ориентирами.

Какой проект вы бы назвали самым успешным?

Юрий Карев: Если измерять успех в деньгах, то, безусловно, это проектные модели для риск-менеджмента и CRM. Они приносят банку прямой экономический эффект.

Но если говорить об инженерном и организационном прорыве, то я бы выбрал геомодель для оценки недвижимости. Она родилась из срочной бизнес-задачи — обеспечить запуск льготной ипотеки и финансирование застройщиков. Мы буквально за полгода создали прототип, доказали, что точность нашей оценки выше, чем у агентств, и начали использовать модель в пилотных городах. Через несколько месяцев система работала уже в сотне локаций. Это пример того, как правильно организованный ИИ-процесс позволяет бизнесу быстро реагировать на потребности рынка.

С какими основными сложностями вы сталкиваетесь при внедрении ИИ?

Юрий Карев: Я бы выделил три главных. Первое — постановка задачи. Часто бизнес говорит: «сделайте мне искусственный интеллект, чтобы стало хорошо». На практике нам важно точно сформулировать цель, определить доступные данные и показатели эффективности. Наша роль — фасилитировать, помогать заказчику описать его бизнес-процесс, приземлить гипотезу и построить финансовую модель. Мы даже разработали специальные обучающие курсы, чтобы объяснить, как работают технологии и как выстроить эффективное взаимодействие внутри.

Второе — данные. Часто заказчик не осознает, что у него просто нет нужных данных: либо часть процессов еще не полностью цифровизированы, либо данные неполные или «грязные». Приходится помогать — искать источники, объединять внешние и внутренние данные, формировать витрины. Если данных не хватает катастрофически, проект приходится откладывать в бэклог.

И третье — стоимость технологий. Особенно когда речь идет о LLM. Обучение или даже инференс таких моделей требует мощной инфраструктуры, десятков тысяч GPU. А вычисления стоят дорого: иногда дешевле содержать несколько десятков операторов, чем обрабатывать их запросы через большую модель. Возникает дилемма: с одной стороны, нужно быть бережливым и считать ROI, а с другой — нельзя прекращать R&D, иначе мгновенно отстанешь. Мы держим баланс и практикуем подход «бережливого ИИ» — внимательно оцениваем, где применение моделей действительно оправдано.

Как вы решаете вопросы с качеством и доступностью данных?

Юрий Карев: У нас есть отдельное подразделение, которое занимается анализом источников данных. Сначала мы ищем нужные внутри банка — зачастую они уже есть, просто не используются. Если своих данных недостаточно, подключаем внешние источники, заключаем соглашения с поставщиками. Иногда это позволяет решить задачу без масштабных изменений бизнес-процессов.

Вы упомянули высокую стоимость инфраструктуры. Насколько остра для вас проблема нехватки оборудования?

Юрий Карев: Критической нехватки оборудования на текущий момент нет. Мы обеспечены вычислительными мощностями, хотя масштабироваться, конечно, сложно. Ситуация стабильна во многом потому, что мы еще в 2020 году перешли на open source и отечественные решения, выстроили работу на опережение. Проблем, которые нельзя было бы решить, у нас пока не возникало.

А как вы подходите к вопросам информационной безопасности при работе с ИИ?

Юрий Карев: У нас все модели работают on-premise, в контуре банка. Такой подход обеспечивает необходимый уровень информационной безопасности и контроля над процессами.Тем не менее, с появлением LLM возникают новые вопросы — например, как обеспечить корректность, кто несет ответственность за решение, если его сгенерировал ИИ.

Мы участвуем во всех рабочих группах по регулированию ИИ, которые сейчас формируются, в том числе при ЦБ и Минцифры. Наша цель — выстроить систему регулирования, которая обеспечит безопасность, но не задушит развитие технологий.

Корпоративная ИТ-инфраструктура 2.0. Узнайте как построить доверенную ИТ-архитектуру в сжатые сроки

Если говорить о будущем: какие технологии вы считаете наиболее перспективными для ВТБ на горизонте ближайших лет?

Юрий Карев: Безусловно, это цифровые советники и мультиагентные системы. Наша амбициозная цель — создать low-code платформу, на которой бизнес-аналитик сможет собрать цифрового помощника из готовых компонентов под конкретные задачи. Например, такой агент сможет распознать текст звонка, определить суть обращения и найти ответ в базе знаний. Но здесь возникает два больших вызова: Первый — это модельный риск в новой парадигме. Нужно научить систему автоматически контролировать себя и сообщать пользователю: «Извини, я не могу построить тебе агента, потому что у тебя не хватает данных или задача поставлена неверно».

Второй, и, возможно, самый сложный — регулирование. В обеспечении критических процессов должен быть ответственный. Что делать, если решение принимает ИИ-агент? Нам предстоит выработать очень тонкие подходы к регулированию ИИ, которые, с одной стороны, не допустят критических ошибок, а с другой — не задушат развитие отрасли избыточным контролем. Это тонкая грань, и мы активно участвуем в этой работе вместе с регулятором и профессиональным сообществом.