Проект

Москва ищет технологии для анализа транспортных и медицинских больших данных

Заказчики: Департамент информационных технологий Москвы (ДИТ)

Москва; Государственные и социальные структуры

Подрядчики: Гос-эксперт


Дата проекта: 2016/06 — 2016/10
Бюджет проекта: 12,9 млн руб.

Московское правительство в июле 2016 года занялось поиском решений, позволяющих «быстро строить сложные прогнозы и осуществлять интерактивное взаимодействие с пользователем, информация о котором хранится в десятках самостоятельных баз данных».

Анализировать и прогнозировать ситуацию на дорогах правительство Москвы намерено с помощью технологий Big Data и машинного обучения
«
Современные технологии для совместного использования позволяют не собирать все данные систем-источников в одно физическое хранилище данных, а работать с ними удаленно, на тех серверах и в тех программах, которые ими управляют в материнских системах, - говорится в документах столичного ИТ-департамента, опубликованных в рамках тендера по поиску таких решений[1]. - Наиболее продвинутые технологии анализа распределенных данных лежат в области нейросетевого программирования, машинного обучения и других прикладных тематических направлениях
»

Основным итогом обработки информации из различных источников в ДИТ Москвы видят существенное повышение качества предсказаний.

«
Это возможно при наличии развитых инструментов работы с признаками (преобразования, конструирования и отбора) и набора различных классов прогнозных моделей (геометрических, вероятностных, логических), которые с необходимым уровнем достоверности дают прогнозные величины на автоматизированной (т.е. без участия человека) основе
»

Назначением услуг по объявленному тендеру является анализ и рекомендации по применению описанной практики использования информационных технологий для решения задач Правительства Москвы в части получения прогнозных данных.

Выбранный подрядчик (им стала компания Гос-эксперт) должен был сравнить различные подходы для решения задач машинного прогнозирования и сформировать методологические рекомендаций по их использованию в ИТ-ландшафте Москвы.

В частности, требовалось провести анализ технологий для решения аналитических задач на основе работы с большими данными и алгоритмами машинного обучения «от таких лидеров отрасли, как IBM, Oracle, SAS, SAP и т.д., а также в рамках инициатив по созданию свободно-распространяемого программного обеспечения, прежде всего в рамках деятельности Apache Software Foundation (проекты Hadoop и Ignite)».

Также должна была быть сформирована методология применения ИТ в столице при использовании средств аналитики, основанных на элементах машинного обучения, созданы правила обработки структурированной, слабоструктурированной и не структурированной информации разной направленности (геолокация, действия на сайтах и в мобильных приложениях, социальные сети и т.д.).

Победитель должен был сформировать методические рекомендации по использованию математического аппарата, заложенного в основу алгоритмов работы с данными и набор необходимых алгоритмов в контексте решаемых задач регрессионного анализа, построения нейронных сетей и машинного обучения, а также функциональные требования на систему машинного прогнозирования.

По итогам анализа московское правительство рассчитывало получить пять прогнозных бизнес-кейсов по применению технологий анализа больших данных в земельной и транспортной сферах (трафик, безопасность движения), здравоохранении (медпомощь и управление потоками пациентов) и сфере услуг.

Примечания