Проект

ВТБ24 создает хранилище на основе Data Lake для анализа клиентских данных

Заказчики: ВТБ24

Москва; Финансовые услуги, инвестиции и аудит

Продукт: Проекты СХД
Второй продукт: Apache Hadoop

Дата проекта: 2017/01 — 2017/05
Технология: СХД
подрядчики - 232
проекты - 615
системы - 747
вендоры - 254
Технология: Центры обработки данных - технологии для ЦОД
подрядчики - 381
проекты - 936
системы - 683
вендоры - 250
Технология: СУБД
подрядчики - 261
проекты - 748
системы - 301
вендоры - 144

7 августа 2017 года ВТБ24 объявил о создании платформы Data Research Platform для хранения и исследования клиентских данных на основе Data Lake («озеро данных» — термин, описывающий любые крупные объемы данных. Фактически это репозитарий, в котором хранится огромный объем «сырых» данных в их первоначальном формате до тех пор, пока они не будут использованы).

Ход проекта

По предварительной оценке, модели на основе данных о поведении клиентов способны принести банку ежегодно до 1,2 млрд рублей. дополнительного дохода и 30 млрд рублей дополнительных продаж.

По информации ВТБ24, Data Research Platform позволяет банку детально анализировать клиентское поведение. В ней аккумулируется абсолютно вся информация о заемщиках, которая в дальнейшем используется в работе заинтересованных банковских систем. Получаемые в результате исследований прогнозы поведения позволят формировать оптимальные кредитные условия и индивидуальные процентные ставки, основанные на оценке риска по кредитному продукту.

Поставленная задача в мировой практике реализуется через построение Data Lake и создание на его основе исследовательской платформы обработки данных, которые загружаются на нее без каких-либо преобразований. Для работы с клиентской информацией будут использоваться средства глубинного анализа Data Mining.

«
В 2016 году мы реализовали крупный проект по обработке и анализу клиентской информации. Результат его внедрения — существенное увеличение основных финансовых показателей ВТБ24 за счет улучшения клиентских предложений. И система анализирует только 60% всех имеющихся в банке данных. При создании Data Researh Platform мы охватываем 100% данных и проверяем наши гипотезы о клиентском поведении и его влиянии на платежеспособность. Анализ этой информации позволит снизить риски при кредитовании и улучшить условия банка по кредитным продуктам, — рассказал член правления ВТБ24 Александр Соколов.
»

«
Мы заинтересованы в интеграции ИТ в бизнес. При выборе инновационных процессов мы ориентируемся именно на те проекты, внедрение которых обеспечит максимальный эффект. Создание платформы по анализу клиентских данных с применением Data Lake позволит нам обеспечить не только хранение и обработку огромного массива исторических данных, но и выйти на новый уровень решения задач аналитического CRM, управления рисками, получить экспертизу в глубинном анализе данных, вырастить собственных учёных и пользователей профилей Data Architect и Data Scientist», — добавил Сергей Русанов, член правления, директор департамента банковских и информационных технологий ВТБ24.
»

Итоги первого этапа

На 7 августа 2017 года ВТБ24 завершил первый этап работ по настройке, пилотированию механизмов, подходов и технологий и, как итог, развернул платформу Data Researh Platform. Сейчас она обеспечивает работу пользователей профиля Data Architect и Data Scientist с полной безопасностью доступа к данным.

В то же время, развернута тестовая среда, обеспечена катастрофоустойчивость решения. Data Research Platform реализуется в экосистеме Hadoop с использованием Open Source-технологий и промышленных enterprise-решений.

Следующим этапом станет реализация улучшенных моделей с учетом обогащения «сырыми данными» и выход на запланированный бизнес-эффект.