24 ноября 2020 года в рамках онлайн-конференции TAdviser SummIT, в которой приняли участие более 700 человек, прошла сессия «Системы искусственного интеллекта». Мероприятие вызвало особый интерес, поскольку в качестве спикеров выступили практикующие эксперты: представители крупных компаний, накопивших опыт внедрения ИИ-решений, и их партнеры, выполняющие такие проекты.
В общей сложности к сессии подключились 113 участников, в числе которых представители таких компаний как РЖД, Счетная палата РФ, ДИТ г. Москвы, «Почта России», Московский метрополитен, «Аэрофлот», «Алроса», «Бургер Кинг», «Норникель», «Транснефть», ЕВРАЗ, Национальный медико-хирургический центр, Московская биржа, ФК «Банк Открытие», Leroy Merlin Vostok и многих других.
Сказать, что сфера решений искусственного интеллекта (ИИ) развивается быстро, это значит не сказать практически ничего. На рынке предлагается все больше продуктов разной степени зрелости, публичный хайп подогревает ожидания и фобии. Но что-то препятствует превращению хайпа в «девятый вал» массовых внедрений.
Одна из причин, как это ни покажется парадоксальным, - это «всеядность» ИИ-решений, которые могут найти применение буквально в каждой компании и каждой отрасли экономики. Вокруг большой мир и множество событий в нем. Мы вынуждены опираться на данные, их отражающие, чтобы обнаруживать закономерности и тренды, отметил касательно универсальной применимости подходов искусственного интеллекта Илья Кузьминов, директор центра стратегической аналитики и больших данных, в.н.с. Институт статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ. Он выступил в роли ведущего онлайн-сессии TAdviser «Системы искусственного интеллекта».
Нарастающий вал ИИ-продуктов и решений, который мы наблюдаем в последние годы, связан, в первую очередь, с бурным технологическим прогрессом в области глубокого машинного обучения (Deep Learning/Machine Learning), что дает публике сегодня основания ставить знак равенства между ML/DL и понятием ИИ в целом.
Борис Зингерман, руководитель направления цифровой медицины «Инвитро» и глава Ассоциации разработчиков и пользователей искусственного интеллекта в медицине «Национальная база медицинских знаний» (НБМЗ), напомнил о том, что нынешний бум ML/DL – далеко не первое событие такого рода в мировой истории ИИ. Индустрия искусственного интеллекта за десятилетия ее развития уже пережила два «лета» и две «зимы». Сегодня в ученой среде пошли разговоры о третьей «зиме ИИ», то есть периоде спада общего интереса к данной теме.
Впрочем, стоит заметить, что эта смена «времен года» развивается по спирали, и каждое следующее «лето» оказывает гораздо более серьезное воздействие на реальные секторы экономики, чем предыдущие. Именно это и показала конференция TAdviser: все представленные доклады описывали сложные интеллектуальные проекты, выполненные в различных отраслях экономики.
Отличительным признаком нынешнего этапа следует считать проникновение ИИ-решений в основные производственные процессы предприятий. Об этом рассказывали представители РЖД, аэропорта «Шереметьево», а также компании Crayon, консультанта и интегратора. Безусловно, развивается направление внедрения ИИ для улучшения бизнес-процессов. Здесь наблюдается явное смещение фокусов проектов с вспомогательных функций в сторону поддержки принятия решений сотрудников и руководителей. В этом направлении, как всегда, лидируют финансовые структуры: свои доклады на конференции представил банк «Уралсиб», Tinkoff, «ВТБ Капитал». На позиции лидера также явно претендует здравоохранение.
Как справедливо отметил Илья Кузьминов, преимущества интеллектуальной обработки данных заключаются в преодолении ограниченности человеческих возможностей. Фактически об этом и шел заинтересованный разговор на конференции: какие ограничения, свойственные человеческой природе, преодолеваются, и насколько успешно это делается сегодня. Собственно, успешность попыток «вырваться за флажки», установленные природой, на нынешнем этапе и объясняет тот факт, что серьезные проекты ИИ пока не вышли на массовый уровень внедрений. Посмотрим далее, каких результатов достигают «ударники ИИ-труда», и что ограничивает аналогичное развитие в массовом масштабе.
Какие технологии AI/DL/ML подталкивают нынешнее развитие?
Специалисты ИСИЭЗ НИУ ВШЭ осуществили большое исследование с помощью собственной системы текстовой аналитики iFORA: используя более 400 млн. документов, построили семантическую карту мировых трендов в развитии ИИ.
В числе технологических трендов, которые сегодня находятся в фокусе внимания, Илья Кузьминов отметил те, которые отражают сегодняшнее состояние ML-технологий и соответствующих проектов:
- Архитектура трансформеров – модель обучения глубоких нейронных сетей, которая была предложена в 2017 г. Трансформеры похожи на рекуррентные нейронные сети, предназначенные для обработки последовательностей, например, текстов на естественном языке (ЕЯ), но с гораздо более высоким уровнем параллелелизма в обработке, что значительно ускоряет процессы обучения нейронной сети. Сегодня наблюдается настоящий бум этой архитектуры – ее пытаются использовать для самых разных задач: от распознавания изображений до генерации музыки, отмечает Илья Кузьминов.
- Генеративные алгоритмы машинного обучения. Накопленный опыт их практического применения говорит о том, что эти алгоритмы пока дают слишком много ошибок.
- Объяснительный функционал ML – «больное место» современного ML.
- Композитный ИИ – подход, который в условиях малого количества данных для обучения, предполагает объединение моделей для того чтобы получить новую, более точную. В этом случае реализуется механизм, так называемого, федеративного обучения: из большого числа моделей с соответствующими небольшими дата-сетами формируется объединенная модель, причем, это не требует консолидации данных.
- Process intelligence – методы интеллектуального анализа бизнес-процессов. Речь идет об обогащении функционала систем управления бизнес-процессами (BPM) семантическими инструментами.
- «Дистилированные» модели. Современные модели, от которых много ожидается, очень велики. Скажем, модель GPT-3, способная генерировать ЕЯ-текст, сегодня на пике популярности. Она требует таких вычислительных ресурсов, что ее непросто запустить даже на инфраструктуре специализированного подразделения НИУ ВШЭ, отметил Илья Кузьминов.
- MLOps – фактически это DevOps для машинного обучения: механизм, позволяющий в прозрачном режиме обучать и переобучать модели, автоматически их развертывать в конвейере обработки данных.
ИИ в основных производственных процессах
Пожалуй, на всем многообразии процессов развития, связанных с моделями обучения глубоких нейронных сетей, просматривается единый мощный тренд – переход к технологическим упражнениям в сфере DL/ML на базе ряда моделей. Эта конфигурация более соответствует реальным задачам, которые требуются современным предприятиям и организациям. Этот тезис подтверждается примерами проектов, о которых рассказали докладчики конференции TAdviser «Системы искусственного интеллекта».
ML в сельскохозяйственной промышленности
Норвежская компания Crayon, недавно начавшая работать на российском рынке, специализируется на высокотехнологичных проектах для компаний из различных отраслей экономики. Она развивает направление ИИ и машинного обучения как одно из ключевых, и в ее портфеле – ряд интересных проектов в различных отраслях. Например, крупное кооперативное объединение производителей молока в Норвегии, которое охватывает более 20 тыс. участников, включая 11,5 тыс. индивидуальных предпринимателей и более 9 тыс. фермерских хозяйств.
У этого объединения производителей была одна серьезная проблема – неточное прогнозирование сбыта готовой продукции, которое применительно к скоропортящейся продукции (молоко, мясо) приводило к серьезным финансовым потерям из-за неразвитости логистических цепочек.
Как рассказал Владимир Еронин, директор Центра компетенций по искусственному интеллекту и анализу данных московского офиса Crayon, для аграриев был разработан целый ансамбль моделей, которые предсказывают не только объемы производства по каждому типу продукции, но и характеристики конкретного вида продукции, например, жирность молока и содержание протеина.
В результате точность прогноза выросла на 40%. Это позволило оптимизировать не только транспортную составляющую, но и стоимость последующей переработки продукции, и привело к общему снижению ее себестоимости до 7% (в зависимости от вида продукции). Интересная деталь проекта – он реализован на базе сервисов AWS.
Другой пример - риэлторская компания. Она увидела проблемное место в своей деятельности – большое количество ручного труда на этапе оценки коммерческой недвижимости: выезд эксперта на место, анализ повреждений и т.п. Заказчику предложили нетривиальное решение – использовать в качестве «выездного сотрудника» БПЛА, а полученные с его помощью данные обрабатывать с помощью ML-решения, размещенного в облаке AWS.
Специалисты Crayon разработали набор моделей, которые занимаются анализом фотографий, сделанных дроном: классификацией поверхностей, обнаружением повреждений, оценкой масштаба этих повреждений. Затем вся полученная информация используется для оценки стоимости восстановительных работ. Здесь также используется механизм дообучения модели в ходе эксплуатации, отметил Владимир Еронин. По его оценкам, масштаб полученной в результате применения новой системы дополнительной выручки – около 3 млн. долл. в год. Такие результаты показала система по итогам первого года эксплуатации.
Использование сервисов AWS не является принципиальным требованием для реализации таких проектов.
Можно построить решение на любой инфраструктуре: и гибридной, и on-premise, то есть полностью в инфраструктуре заказчика. Хранилище моделей можно также организовать на площадке заказчика,- пояснил Владимир Еронин. |
ML для управления процессами международного аэропорта
Московский аэропорт «Шереметьево», безусловно, относится к числу крупных объектов со сложнейшими процессами: более 10 сотрудников, тысячи видов оборудования, неоднородная загрузка и зависимость от погодных условий.
У нас не то, что каждый день не похож на другой, вы не найдете ни одного похожего часа, - так образно описал специфику деятельности аэропорта Сергей Коняхин, директор Дирекции производственного моделирования аэропорта «Шереметьево». |
Один из важнейших параметров, характеризующих работу этого огромного комплекса, - загрузка самолета.
Традиционно в качестве базового значения при планировании загрузки принималось 80% среднегодового значения от уровня компоновки самолета. При этом в отдельные дни отклонения могли достигать 40%, замечает Сергей Коняхин. Перед ИТ-службой «Шереметьево» была поставлена задача: используя все сведения о различных аспектах работы аэропорта, повысить точность прогнозирования загрузки самолетов, что должно снизить риски ошибок в реальной загрузке и привести в результате к повышению прибыльности аэропорта. А таких аспектов, которые с той или иной степенью предсказуемости влияют на работу авиаузла, огромное количество: прибытие рейсов, загруженность парковки, выпавший снег, который корректирует характеристики прибытия пассажиров, наличие багажа.
Некоторые процессы, как, например, регулярную переподготовку персонала, можно неплохо спланировать. Разницу в загрузке самолетов между периодом летних отпусков и поздней осенью можно оценить весьма приблизительно (они различаются в 1,5 – 2 раза). А локальные пики загрузки зачастую вообще не поддаются прогнозированию.
«Порой подводят хоккейные команды, которые неожиданно портят прогнозы по багажу, - делится переживаниями Сергей Коняхин. |
А еще нужно постараться оптимизировать перегон техники между самолетными стоянками, которых в «Шереметьево» 200 штук, организовать перегруппировку техники между площадками в ночной период, чтобы подготовиться к полетам следующего дня. К тому же деятельность аэропорта совсем не статична – расписание рейсов постоянно меняется, а разное число пассажиров следует через «Шереметьево» транзитом. А это, в свою очередь, напрямую влияет на длину очереди на рейсы. И здесь критически важно уметь отслеживать и в реальном времени интерпретировать текущую длину очереди: находится ли она в зоне психологической приемлемости или возник риск опозданий пассажиров на рейс?
По оценке Сергея Коняхина, выбор технологий ML ИТ-департамент аэропорта сделал по вполне определенной причине:
Для нас критически важно такое свойство машинного обучения, как способность запоминать огромное количество разнородных данных и обучаться на основе опыта. |
Задача на разработку ИТ-системы была сформулирована с точки зрения разгрузки оперативно-диспетчерского персонала.
Человеческий мозг диспетчера не в состоянии уследить за всеми аспектами, которые нужно контролировать, и мы стали строить рекомендательную систему для оперативно-диспетчерского персонала, - рассказал Сергей Коняхин. |
В основу этой системы положено низкоуровневое моделирование: данные собираются буквально о каждом пассажире, каждой единице багажа и технического оборудования аэропорта. Кроме того, система поддерживает перебор множества сценариев развития событий.
Загрузка аэропорта очень рваная, поэтому без прямого перебора вариантов не обойтись, - пояснил Сергей Коняхин. |
Полученный результат, по его оценкам, далеко превзошел ожидания:
По сути, мы хотели справиться с одной большой проблемой – неспособностью диспетчера глубоко анализировать ближайшее будущее. А с помощью ML-моделей удалось провести полномасштабную «калибровку» все системы на реальных процессах, - говорит Сергей Коняхин. |
Теперь ML-систему можно использовать даже для поверки гипотез: если появляется идея, которая может привести к оптимизации ресурсов аэропорта (там ведь используется огромное количество разнообразных технологий), ее работоспособность можно проверить в системе. А топ-менеджмент компании получает в виде отчетных сведений результаты многофакторного анализа: скажем, не просто сведения о падении параметра EBITDA по тому или иному направлению, а детализацию состояния, где указаны не только суммы падения доходов, но и причины.
По словам Сергея Коняхина, внедрение рекомендательной ML-системы для оперативно-диспетчерского персонала дало возможность аэропорту «Шереметьево» экономить десятки миллионов долларов ежегодно.
Автоматическая диспетчеризация – это устойчивый тренд развития. Постепенно умной программе будут передаваться функции диспетчера, который никогда не устает и не отвлекается на посторонние занятия, - уверен Сергей Коняхин. - Но, конечно, ни в коем случае нельзя говорить о замене человека искусственным интеллектом. Вопрос в качестве их совместной деятельности, в том, насколько ИИ усиливает ЕИ, то есть естественный интеллект. |
Вполне вероятно, полагает он, что с течением времени диспетчеры–люди станут выполнять роль консультантов, решающих сложные задачи, а рутинные работы передадим автоматической системе. Однако ключевым элементом для создания таких систем, уверен эксперт, будут не математические модели, а внутренние знания о корпоративных технологиях и процессах.
ML для диспетчерского управления железнодорожным транспортом
Масштабная программа цифровой трансформации РЖД - все 55 проектов - продолжает выполняться в полном объеме, невзирая на кризисные явления в экономике в связи с пандемией. Произошло только некоторое смещение приоритетов в сторону бесконтактных систем, а также систем ИИ, облегчающих работу сотрудников в сложных условиях, рассказал Евгений Чаркин, директор по информационным технологиям РЖД.
Часть таких проектов уже завершена. В частности, внедренные системы RPA дают прирост производительности труда сотрудников от 30% до 70% по разным направлениям. Работает система распознавания номеров вагонов для автоматического списывания составов, а также комплексные системы диагностики состояния объектов инфраструктуры РЖД: железнодорожные пути, контактная сеть.
Можно сказать, что под контролем нейросетей у нас находится вся транспортная сеть РЖД – по всем ее участкам передвигаются измерительные лаборатории, которые собирают данные для контроля состояния сети с помощью модели ML, - рассказал Евгенй Чаркин. |
В ходе пилотного проекта на станциях Лоста и Кинель на 10 маневровых локомотивах тестируется система экстренного торможения на базе технологий машинного зрения, ориентированная, как на маневровые, так и магистральные локомотивы.
Важнейшее направление работ в сфере информатизации РЖД – повышение эффективности основного производственного процесса, то есть перевозок. В качестве приоритетного проекта в этой части выбрано улучшение работы сортировочной станции. Ее основная работа заключается в переработке вагонопотоков и формировании составов в оптимальном режиме. Критерий оптимальности – минимальное и обоснованное время нахождения вагона на сортировочной станции.
Главное действующее лицо этого процесса – маневровый диспетчер. Весь его рабочий день представляет собой череду напряженных моментов принятия ответственных решений, так как именно он является ключевым звеном для обеспечения сквозного процесса работы станции.
Фактически работа маневрового диспетчера – это постоянное решение оптимизационных задач разного уровня сложности в условиях дефицита времени, - пояснил Евгений Чаркин. |
А, значит, именно этот участок работ содержит большой потенциал по увеличению эффективности управленческих решений. И именно поэтому в ИТ-департаменте решили создать рекомендательный цифровой сервис для маневрового диспетчера, способный одновременно анализировать большое количество факторов.
Мы хотим, чтобы сервис взял на себя часть рутинной работы диспетчера и позволил ему фокусировать внимание на сложных ситуациях, например, там, где есть угроза безопасности или риск существенного падения производительности работ, - отметил Евгений Чаркин. |
Прототип сервиса проходит тестирование на станции Челябинск-Главный и уже позволил сэкономить 20% времени простоя вагонов.
Это огромные деньги в масштабе всей сети, - комментирует Евгений Чаркин. |
Обученная модель понимает, что происходит на станции с высокой степенью детализации и предлагает управленческие решения, исходя из критерия минимизации среднего времени простоя вагонов. Полученные в ходе пилота результаты впечатляют: если ранее среднее время простоя вагонов для последовательности поездов составляло 9,4 часов, то рекомендации ML-модели позволили снизить этот параметр до 7,5 часов.
В РЖД говорят, что опыт, накопленный в ходе создания рекомендательной ML-модели для маневровых диспетчеров, будет далее развиваться в грузовом блоке бизнеса компании: с помощью решений ИИ там предполагается формировать максимально персонализированный пакет услуг клиентов железнодорожной компании.
ИИ в работе врача - диагноста
По оценке Бориса Зингермана, сегодня состояние ИИ в медицине характеризует, в первую очередь, результат прошедших 10–15 лет цифровизации страны – это объем накопленных данных. Они составляют цифровую базу, на которой может активно развиваться искусственный интеллект в здравоохранении.
Знаковый в этом смысле проект Mosmed.AI осуществляется сегодня в Москве: в рамках единого радиологического информационного сервиса (ЕРИС) объединены практически все компьютерные томографы, установки МРТ, прочая лучевая техника, которая установлена практически во всех поликлиниках и части столичных стационаров. Снимки со всех установок помещаются в единое хранилище изображений, с которым с конца прошлого года работает более десятка ИИ-сервисов, помогающих докторам (их сейчас более 530) анализировать снимки. К концу ноября проведено около полумиллиона исследований.
Задачей проекта является не замена врача, а помощь в его работе – ИИ-система выявляет среди снимков, предназначенных для обработки, те из них, на которые врачу следует обратить особое внимание (так называемый, триаж в рабочем списке радиолога). Второе направление работы системы – автоматическая генерация заключения по радиологическому исследованию и выделение значимых артефактов в компьютерных томограммах.
Несмотря на то, что текущая ситуация с компьютерной диагностикой нисколько не напоминает замену врача программой, некоторые этические вопросы уже возникают, считает Борис Зингерман. Речь идет о некотором навязывании врачу мнения компьютерной системы. Скажем, в течение многих лет кардиографы поставляются со встроенной программой анализа кардиограмм. Ее врачи обычно первым делом отключают после запуска оборудования в работу, поскольку считают, что эти советы только мешают работать врачу.
В одной из районных поликлиник ЯМАО недавно был проведен эксперимент с ИИ-решением Botkin.AI для визуальной аналитики с целью раннего выявления признаков онкологических заболеваний легких. В этом случае компьютерная система подключалась на втором этапе – ей передавались снимки, на которых человек-доктор не обнаружил признаков заболевания. Оказалось, что примерно на 10% снимков человек не увидел ничего подозрительного, а ИИ-система «разглядела» признаки патологии.
Как должен разрешаться решаться этот щекотливый вопрос приоритетности доверия к мнению человека и интеллектуальной системы? По идее, проблематика сводится к ответственности: если умная программа – всего лишь помощник человека, значит, ответственность за принятое решение полностью лежит на человеке. А значит, у доктора нет возможности избежать этой ответственности, сославшись на то, что «система так сказала». Но как этот механизм ответственности реализовать на практике?
Вполне вероятно, считает Борис Зингерман, решение будет найдено в иной плоскости. Например, врач-диагност будет работать с цифровой копией человека, которая будет включать и все те соображения, которые появились в «мозгу» умной программной системы. Или выводы искусственного разума всегда будут играть роль «второго мнения», к которому человек сможет прибегнуть в случае необходимости? Или будет обязан выслушать это второе мнение? Готовых рецептов действий пока нет, их только предстоит выработать параллельно с экспериментальными проектами ИИ в медицине.
Врач из коробки
Умные технологии не отменяют ответственности врача за принятие решения, но меняют способы коммуникации доктора с пациентом. Пример умных коммуникаций – «врач из коробки», сервис медицинского обслуживания TytoCare, предлагаемый израильским медицинским центром Hadassah Medical Moscow. Смысл сервиса в том, что пациент получает домашнее оборудование, с помощью которого он самостоятельно осуществляет сбор ряда параметров своего здоровья и отправляет цифровые данные своему лечащему врачу в клинику.
Количество разнообразных медицинских гаджетов, предлагаемых людям, быстро растет. Они порождают большое количество цифровых данных, которые скапливаются в цифровых хранилищах медицинских организаций. Эти данные, особенно, если будет происходить агрегация хранилищ, как в московской системе ЕРИС, станут основой для множества умных и полезных медицинских сервисов.
Однако количество врачей останется примерно прежним. Кто будет заниматься интеллектуальной обработкой этой массы накапливаемых данных? - задается вопросом Борис Зингерман и предлагает ответ. - Это поле для работы программ искусственного интеллекта. Интеллектуальные программы будут работать на первом уровне обработке данных пациентов. Они будут отправлять врачу только те запросы, которые, с точки зрения ИИ, требуют участия доктора. ИИ, конечно, не заменит врача. Но врачи, которые используют ИИ, заменят тех, кто такие средствами не пользуется. |
Такие системы поддержки врачебных решений (СППВР), по мнению эксперта, будут дополняться на нижнем уровне интеллектуальными рекомендательными системами, предназначенными для пользования самими пациентами (системы поддержки принятия пациентских решений, СПППР). Они преобразуют принятые сегодня методы самолечения на основе сведений, почерпнутых из интернета и соцсетей, в профессиональные советы, опирающиеся на анализ состояния конкретного человека.
Раньше медицинское обслуживание начиналось с похода к врачу, а скоро оно этим будет заканчиваться, потому что рутинное наблюдение и коммуникации будут осуществлять телемедицинские технологии и искусственный интеллект. Это будущее, в которое мы уверенно идем, - подчеркнул Борис Зингерман. |
По мнению эксперта, эта картина станет реальностью в перспективе 10 лет.
ML для повышения эффективности промо-программ онлайн-ритейлера
Компания Crayon выполнила проект для глобального онлайн-ритейлера, у которого уже работали различные развитые ИТ-системы, включая рекомендательный сервис. Однако текущая реализация сервиса, выполненная на основе логических правил, не обеспечивала требуемый уровень персонализации обслуживания посетителей сайта. Заказчик поставил задачу создать новую рекомендательную систему, которая будет использоваться в персонализированных программах продвижения и позволит заметно увеличить конверсию.
Как рассказал Владимир Еронин, новый сервис использует две отдельных модели ML: одна – для продуктовой категории, другая – для продукта внутри категории. Эти модели используют более 75 параметров для описания пользовательского поведения, и их можно дообучать в ходе эксплуатации системы. За счет непрерывного дообучения решение способно выдавать рекомендации, базирующиеся, в том числе, на только что принятых решениях, подчеркнул Владимир Еронин:
Фактически ИТ-решение позволяет быстро реагировать на действия, которые пользователь выполняет прямо в текущий момент, то есть реагировать на то, что его заинтересовало, показывать близкие модели в разделе рекомендаций. |
В результате повышение конверсии в программах продвижения произошло во всех категориях изделий, а в некоторых составило 7 раз. Кроме того, система позволила выявить новые тренды в поведении потребителей в зависимости от их местоположения и улучшить внутренние процессы организации.
Сегодня рулит прикладной ИИ, нацеленный на решение конкретных прикладных задач, - уверен Владимир Еронин. - В любой индустрии и любой компании можно найти место для использования ИИ, нужно только отталкиваться не от имеющихся данных, а тех участков бизнеса, где ИИ может разрешить имеющиеся проблемы. |
ML для улучшения бизнес-аналитики банка
Юрий Сирота, старший вице-президент, Chief Analytics Officier банка УРАЛСИБ поделился своими представлениями о нынешнем уровне развития аналитических подразделений современных организаций:
В большинстве компаний аналитический отдел – это фабрика по производству отчетов. |
Причем, на это «производство» работает мощная и дорогостоящая ИТ-инфраструктура: аналитик формирует запрос на сбор данных, затем формируется витрина данных, к ним получает доступ либо Excel либо BI-система, которой пользуется аналитик. И, в конце концов, руководитель получает в свое распоряжении некоторую визуализацию данных.
Однако это всегда ретроспективный взгляд в прошлое. А мы используем модели машинного обучения для того, чтобы создать вероятностную картину в будущем, - рассказал Юрий Сирота о подходе банка к усовершенствованию бизнес-аналитики. |
При этом эксперт отделяет предиктивную аналитику (прогноз будущего состояния) от предписательной аналитики, которая показывает наиболее выгодный путь к достижению будущего состояния.
Предписательная аналитика - это самый сложный в реализации вариант аналитической системы, но одновременно и самый мощный: он не просто говорит о том, что есть и что может быть, но и том, каким образом нужно идти к достижению цели, - полагает Юрий Сирота и заключает. - Результат такой аналитики – это управление. Соответственно, ответственность за такое решение серьезнее, ведь речь идет о финансовом результате предполагаемого управления. |
Он приводит пример работы такой системы для задачи сбора задолженностей (collection). Механизм управления в данном случае решает задачу: каким образом увеличить сбор взысканий и снизить просрочку оплаты? Аналитический результат в виде предписания имеет следующий вид: выбрать определенные сегменты должников и подобрать меры воздействия на них, которые могут существенно различаться - кого-то подбодрить, а кого-то наказать.
По мнению Юрия Сироты, залог успешности проекта ИИ в любой предметной области – глубокое знание этой предметной области.
Знание предметной области первично. Кроме того, успешный проект может быть реализован только единой кросс-функциональной командой, где нет разрыва между ИТ и бизнесом, - уверен он. |
К числу других факторов успеха эксперт отнес свойство обучаемости для используемых моделей (модели ML необходимо постоянно тюнинговать, чтобы постоянно выявлять новые закономерности) и встраивание моделей в рабочий процесс.
Необходимы изменения бизнес-процессов для того, чтобы следовать рекомендациям предписательной аналитики, - отметил Юрий Сирота. - А это уже инфраструктурная задача: ИТ-разработчики строят сложные прогностические модели, но ИТ-системы банка не способны их интегрировать или обеспечивать выполнение с приемлемой задержкой. |
ML для повышения качества ИТ-обслуживания сотрудников банка
В компании «ВТБ Капитал», как и любой современной финансовой организации, уже работает немало различных информационных систем. В частности, более 60% заявок пользователей по поводу ИТ-обслуживания регистрируются через портал самообслуживания, который поддерживает более 100 сервисов. Однако 40% заявок, которые регистрируются на первой линии Service Desk вручную, - это существенный потенциал для повышения эффективности работы службы Service Desk, решили в ИТ-отделе компании.
По нашим оценкам, за счет одного только правильного определения категории обращения в службу можно сэкономить не менее 5% времени, затрачиваемого на одно обращение. Это всего несколько секунд, но если их умножить на сотни обращений в день, они дают существенную экономию, - рассказал о задаче проекта Владислав Русаков, IT Service Delivery Systems Manager компании «ВТБ Капитал». |
Работа началась с базы из 10 тыс. сообщений и 110 категорий. Из первичной базы была сформирована первичная обучающая выборка объемом 2,5 тыс. сообщений. Особенность текстов – русский язык в смеси с английским и с активным использованием профессионального сленга. Обучающая выборка наращивалась в ходе тестирования, и теперь она включает 12,5 тыс. примеров. В ходе создания системы к первоначальным механизмам ML пришлось добавить ЕЯ-модель BERT, что существенно повысило качество распознавания категорий. Достигнутая точность предсказания категории сообщения составляет 81%. Категория – вещь динамическая, отметил Владислав Русаков, и к настоящему времени система работает с 120 категориями запросов.
Внедренное решение на базе ML ориентировано, в первую очередь, на те услуги, которые приведены на портале самообслуживания. Поэтому вслед за автоматической категоризацией был реализован функционал автоматического ответа на запрос пользователя.
К тому же, удалось повысить комфортность взаимодействия пользователей с порталом самообслуживания.
Раньше поиск на портале реализовывался по ключевым словам, и сотрудникам нужно было точно знать, что они ищут. Использование модели ML позволило реализовать на портале самообслуживания интеллектуальный поиск «в стиле Google, - отметил Владислав Русаков. |
Следующие шаги в развитии функциональности – автоматическое консультирование, вначале по простым, но массовым вопросам, а также автоматическое информирование о статусе заявки. Как отметил представитель «ВТБ Капитал», в системе даже есть возможность отправить письмо сотруднику, ответственному за исполнение заявки, с обоснованием, почему ему следует ускорить работу над заявкой. При этом прямого контакта с исполнителем не предоставляется.
И «вишенка на торте» - виртуальный помощник оператора Service Desk, который на основе анализа содержания письма создает шаблон заявки с предварительно заполненными полями. Таким образом, через год тестовой эксплуатации системы 8% всех заявок, поступающих в службу Service Desk «ВТБ Капитал», обрабатываются полностью автоматически. На консультациях экономится до 50% времени операторов, на заявках – до 30%.
Проект оказался для компании экономически выгодным: полученная экономия не только покрыла затраты на разработку, но и дала дополнительный финансовый эффект, пояснил представитель «БТБ Капитал». Компания намерена далее его развивать.
Мы хотим из обычной службы Service Desk сделать Smart Service Desk, который не просто быстро регистрирует заявки на ИТ-обслуживание, но и помогает пользователям вплоть до выполнения функций второй линии сервиса, - рассказал Владислав Русаков. |
Голосовой робот для поддержки пользователей Service Desk РЖД
В период пандемии, как отметил Евгений Чаркин, одной из серьезных задач ИТ-подразделения стало обеспечение возможности пользователей работать продуктивно и безопасно в удаленном режиме. С этой целью в службе поддержки пользователей был запущен голосовой чат-бот с постоянно расширяющейся базой знаний. По оценке Чаркина, эффективность обработки обращений пользователей выросла более, чем на 22%.
Умный чат-бот для поддержки работы врача
Рекомендательные системы – одно из флагманских направлений развития ИИ-решений, имеющее особое значение для сферы здравоохранения. В ассоциации «Национальная база медицинских знаний» разработана платформа Medsenger.AI с интеллектуальными агентами, которые освобождают врача от рутинных коммуникаций с пациентом.
Это вариант чат-бота. Но, в отличие от большинства подобных систем, присутствующих на рынке, он умный, поскольку воплощает знания врача-специалиста, и ему можно доверить такую чувствительную сферу, как здоровье человека, - поясняет Борис Зингерман. |
Интеллектуальный агент – это тот самый «специалист, который подобен флюсу, - полнота его односторонняя». Эти агенты, по замыслу разработчиков платформы, будут разрабатываться с участием профессиональных узкоспециализированным команд медицинских специалистов и подключаться к платформе с помощью удобных интерфейсов.
Чат-бот с эмпатией для звонков клиентам
Практически с самого начала эпохи виртуальных помощников разработчики пытались придать им человеческие черты, начиная с привлекательного визуального образа, украсившего многие корпоративные сайты. Эксперименты с «очеловечиванием» персонажей путем придания им некоторого характера, например, давно идут в «Наносемантике» на базе собственных решений обработки естественного языка (Natural Language Processing, NLP). Известную всем Алису NLP-команда «Яндекса» снабдила чувством юмора и умением изрекать глубокомысленные сентенции по пустяковым поводам. Там тоже работает собственный движок речевой аналитики. А в банке «Тинькофф» решили создать голосового чат-бота, который умеет так поддержать разговор с человеком, чтобы вызвать у него желание продолжить общение.
С прагматической точки зрения, такой «приятный во всех отношениях» чат-бот разрабатывался для того, чтобы максимизировать количество успешных звонков клиентам с просьбой оценить качество оказанной услуги. «Тинькофф» хорошо знает стоимость исходящих звонков для разговора «по-человечески» оператора с клиентом – 2,5 тыс. операторов работают в офисе банка и еще 10 тыс. в облаке, рассказал Леонид Колыбин, руководитель продукта голосовых роботов банка «Тинькофф». А после внедрения голосового чат-бота он каждый месяц осуществляет 6,7 млн. звонков (включая переговоры аналогичных роботов, которые внедрены у корпоративных клиентов банка). Теперь он закрывает разные бизнес-направления: клиентское обслуживание, рекрутинг, служба взысканий и т.д.
По оценкам Леонида Колыбина, чат-бот оказался в три раза дешевле собственного оператора контактного центра: 4 руб./ мин. против 12 руб./ мин. Однако для того чтобы достичь такого соотношения стоимость/качество, команде «Тинькофф» пришлось потрудиться над NLP-системой, интегрировав ее с механизмом машинного обучения.
Обычный чат-бот с главной страницы сайта категорически не устраивал разработчиков.
Вообще-то клиентский опыт очень сложно измерить в деньгах. Но представьте, что, скажем, клиент позвонил в банк, чтобы открыть карту, а его встретил «истукан», плохо понимающий слова клиента и неадекватно реагирующий на них. Что будет с вашей конверсией? - поделился своими соображениями Леонид Колыбин. |
В банке разработали собственную систему речевой диагностики Tinkoff.Voicekit, которая, как утверждает специалист, на открытых текстовых наборах данных демонстрирует качество распознавания, практически в два раза выше, чем у популярных на рынке продуктов. Он объясняет это тем, что коммерческие движки распознавания речи чаще всего реализуют работу с так называемыми регулярными выражениями, то есть с часто встречающимися в речи сочетаниями слов.
Однако в ситуации входящего звонка, когда клиента застает врасплох предложение поговорить о полученной услуге, анализ на базе регулярных выражений работает плохо – междометия, паузы, «мычание» и т.п. Компьютерная система не сможет понять, какие признаки содержатся в речи клиента: согласие или несогласие. Сочетание собственного алгоритма NLP с машинным обучением дало падение доли ошибок при распознавании речи в 5 раз: 6% против 31% при использовании традиционных методов на базе регулярных выражений.
Однако высокое качество распознавания само по себе еще не гарантирует желания человека продолжить разговор: ответить на вопросы, выслушать предложение и т.п. Команда Леонида Колыбина стала экспериментировать, моделируя различные «характеры» бота. Часть гипотез провалилась, как, например, предположение о том, что клиент – мужчина будет расположен поговорить с томным женским голосом на другом конце провода. Попытка давить на жалость – «Пожалуйста, ответьте, что вам стоит? А мне очень надо!» - дала, в целом, хорошие результаты, но формировала образ «умоляющего» банка и потому была отвергнута.
Лучшим был признан образ «вежливо-настойчивого» банка, хотя и он не дотягивал до уровня конверсии (удачно совершенных звонков) человека-оператора в опросе по тематике клиентской лояльности (используемого для расчета индекса потребительской лояльности NPS, Net Promoter Score). Озарением стала идея проверить гипотезу влияния на исход разговора степени замотивированности оператора и бота. Анализ переговоров операторов показал, что в ряде случаев они мошенничали, увеличивая количество удачных звонков.
После пересчета конверсии с учетом правильно пройденных NPS-опросов робот обогнал оператора, показав 24% конверсии против 23% у оператора.
Леонид Колыбин раскрыл некоторые приемы, позволившие создать чат-бота, умеющего заинтересованно поддерживать разговор и настойчиво доводить до конца заложенный сценарий. Во-первых, это умение распознавать паузы в словах, отличая их от завершения речи, - технически это непростая задача для NLP-системы. Во-вторых, заполнение пауз заинтересованными поддакиваниями: «ага», «так» и т.п. В-третьих, поддержка открытых вопросов типа «А почему такая низкая оценка?». Использованные психологические приемы достаточно просты, но нетривиальны в технической реализации.
В результате мы получили робота достаточно человечного и весьма эффективного, и к тому же гораздо более дешевого, чем оператор контакт-центра,- резюмирует Леонид Колыбин. - Эти же технологии используются на входящих звонках контакт-центра: система точно определяет проблему клиента и передает звонок нужному сотруднику, минимизируя количество лишних переключений. |
Есть еще одно направление применения собственных NLP-технологий банка – поддержка работы с возражениями. Это сложный участок для оператора, работающего, например, с взысканиями.
Автоматизировать такие переговоры очень сложно, но интеллектуальная система может серьезно помочь оператору, формируя подсказки для перевода разговора в нужное русло,- поясняет Леонид Колыбин. |
Ограничения и проблемные точки для развития массовых внедрений ИИ-решений
В своих докладах на конференции эксперты отмечали проблемные точки, препятствующие более массовому и активному внедрению ML-решений. Перечислим, на что обратили внимание докладчики:
- Общий уровень цифровизации бизнеса большинства компаний: отсутствие нужных данных для обучения моделей, неполные неточные данные, высокая трудоемкость разметки данных для обучения моделей.
- Недостаток данных. Проблема небольшого количества данных, необходимых для обучения специализированных моделей, по оценке докладчиков конференции, со временем становится все очевиднее.
Назревает вопрос создания маркетплейса для небольших данных,- высказал предположение Владимир Еронин. |
- Проблемы качества данных, особенно, если речь идет о компании с достаточно длительной историей цифровизации, как, например, АО «РЖД». Там под «зонтиком» мониторинга собрано несколько десятков миллионов объектов, но они собирались в разное время и в разных ИТ-системах.
Самый большой вызов для нас – это собрать данные и их очистить, чтобы обучение модели было валидным,- пояснил Евгений Чаркин. |
- Сложность подбора параметров ML: параметры модели необходимо постоянно «тюнинговать», причем, делается это методом проб и ошибок. Юрий Сирота отмечает, что при этом важно ориентироваться не на математические метрики, хотя работа идет именно с математическими моделями, а на бизнес-метрики. Сегодня эта работа сродни искусству. Так, например, чрезмерный акцент на краткосрочных закономерностях в данных может нанести ущерб точности модели в будущем.
Нередко худшая математика в реальной модели дает лучший экономический эффект. Хорошая математика и хороший бизнес-подход к настройке моделей коррелируют часто, но не всегда,- заметил Юрий Сирота. |
- Постоянная донастройка модели ML и выделенные дата-сайентисты.
Если этого не делать то модель постепенно деградирует, так как ситуации постоянно меняются,- подчеркивает Владислав Русаков. - А для этого необходим выделенный дата-сайентист, который будет постоянно следить за качеством модели, добавлять новые примеры, категории, исправлять ошибки. |
- Дополнительная перепроверка результатов работы ML модели. Если для конкретной задачи, где используется машинное обучение, требуется высокая точность работы алгоритма, придется проводить дополнительную проверку и перепроверку полученных результатов с привлечением людей. Это значит, что, несмотря на кажущуюся дешевизну алгоритма, стоимость конечного решения будет достаточно высокой, комментирует Илья Кузьминов.
- Сложность ИТ-инфраструктуры, которая требуется для поддержки ML-решений. Один из способов решения данной проблемы – хранение ML-моделей обучающих наборов данных на ресурсах сервис-провайдера и предоставления облачного сервиса работы модели.
- «Демократизация» DL/ML. Илья Кузьминов отмечает, что в этой бурно развивающейся сфере встречаются ситуации, подобные той, что произошла с моделью GPT-3: удачная модель была изъята в приоритетное пользование корпорации Microsoft. Такие ситуации входят в противоречие с трендом на общее пользование моделями и/или данными, который сегодня развивается во всем мире.
Аналитики Gartner называют этот тренд «демократизацией ИИ», подразумевая при этом, что речь идет о вполне коммерческих вещах – о том, чтобы готовые модели и мощные обучающие наборы данных были доступны не только крупным ИТ-компаниям, способным вложить в их создание крупные суммы денег, но и небольшим разработчикам.
- Этические проблемы ИИ. Очертания этих проблем только проявляются. Однако очевидно, что они не будут выражаться в вульгарной форме «человек против машины: кто кого?». Поскольку ИИ-решения в обозримом будущем будут выполнять роль умных помощников человека, возникает необходимость четкого распределения ролей человека и программного помощника при принятии профессиональных решений.
Доверять ли на 100% рекомендациям искусственного интеллекта или перепроверять их, фактически дублировать с помощью человеческого интеллекта? Первый вариант дешевле при масштабных внедрениях, а второй дает наиболее точный результат. В этом и будет состоять главная проблема «этики ИИ» в ближайшие годы: быстро, дешево или точно?
Мы видим, что мир практических внедрений ИИ-решений за счет мощного развития технологий ML/DL буквально на наших глазах шагнул далеко вперед от нишевых NLP-решений типа анализа позитива/негатива в откликах клиентов или анализа разговоров операторов контакт-центров на уровень сложных систем поддержки принятия решений в непростых производственных процессах. Если судить по проектам аэропорта «Шереметьево», «РЖД» или тех, что выполняются в здравоохранении, реальный сектор экономики точно не отстает от финансового – традиционного лидера информатизации – в части сложности внедряемых ИИ-решений. Другая сторона вопроса – массовость таких внедрений.
Докладчики конференции TAdviser «Системы искусственного интеллекта» сошлись во мнении, что наличие данных, даже если их очень много, само по себе не гарантирует легкости внедрения интеллектуальных решений.
Нужно идти от проблем бизнеса. Если есть данные, но нет проблем, нет смысла тратить деньги на искусственный интеллект,- подвел итог обсуждениям Владимир Еронин из московского офиса Crayon. |
Информация о партнерах конференции
Crayon - международная IT-консалтинговая компания в сфере цифровизации бизнеса, основанная в 2002 году в г. Осло, Норвегия. В 2017 году стала публичной компанией, акции которой входят в индекс биржи Осло. Crayon насчитывает более 1600 сотрудников в 45 офисах по всему миру. Компания является сервис-партнёром публичных облачных провайдеров Microsoft Azure, Amazon Web Services, Alibaba Cloud и Яндекс.Облако. Компетенции Crayon сосредоточены в области управления и оптимизации ИТ-инфраструктуры, облачных технологий и разработки решений с применением Искусственного Интеллекта и анализа больших данных. Решения на базе ИИ - одно из приоритетных направления для компании. На настоящий момент у компании Crayon имеется 5 центров компетенций в области ИИ по всему миру, компания развивает аналогичный в России.В 2019 году компания Microsoft признала решение компании Crayon лучшим решением в области ИИ среди партнеров по всему миру. Суммарно у компании более 100 успешно выполненных проектов с применением ИИ по всему миру. В России компания Crayon работает с октября 2020.