Заказчики: Федеральная служба государственной статистики (Росстат) Москва; Государственные и социальные структуры Продукт: Contour BIДата проекта: 2021/07 — 2022/06
Бюджет проекта: 16 000 000 руб.
|
Содержание |
2022: Использование Contour BI для проектирования социальных пособий.
19 июля 2022 года ИТ-компания «Контур Компонентс» сообщила о создании продукта, который даст дополнительные аналитические возможности при разработке мер социальной поддержки населения, позволяя оценивать их с точки зрения эффективности и адресности. Это поможет назначать наиболее подходящие меры поддержки именно тем категориям граждан, которые больше всего в ней нуждаются.
Проект реализован по заданию и под руководством Росстата, по методике Управления статистики уровня жизни и обследований домашних хозяйств. Цель – создать инструмент, позволяющий быстро разрабатывать наиболее эффективные и адресные меры поддержки с точки зрения как повышения уровня жизни наиболее уязвимых групп населения, так и распределения бюджетных средств. Для оценки предлагаемых решений используется показатель «Уровень бедности»: чем больше людей выйдет из состояния бедности при назначении определенной меры, тем более эффективной она считается.
Вызовы, с которыми столкнулась наша страна в последние годы, включая эпидемию COVID-19, оказывали существенное влияние на жизнь людей. Требовалось скорейшее введение новых мер социальной поддержки. Росстат обладает особой базой данных по итогам выборочных наблюдений доходов россиян, которая содержит подробную информацию по различным группам населения, в том числе составляющим группы риска: многодетным, малоимущим, безработным, работникам в сферах, затронутых локдауном, врачам и медицинскому персоналу. До какого-то времени мы успешно использовали эти данные при просчете дополнительных финансовых ресурсов для помощи определенным категориям граждан. Но затем пришли к выводу, что нам не удается успевать за развитием инициатив, и требуется более углубленный подход к просчетам, рассказала Елена Фролова, начальник Управления статистики уровня жизни и обследований домашних хозяйств Росстата.
|
В этой ситуации было принято решение о создании Росстатом нового вида статистического продукта – специализированного сервиса для моделирования различных сценариев оказания мер социальной поддержки.
Для поддержки различных категорий граждан в стране существует множество типов социальных пособий. В регионах виды и размеры выплат могут различаться. Это осложняло работу проектировщиков пособий и затрудняло оценку эффективности принимаемых мер. Поэтому Росстат поставил перед нами задачу – создать продукт, который на основе имеющихся данных позволяет настраивать и сравнивать различные сценарии помощи целевым группам и выдает результаты в виде понятной инфографики, рассказал Владимир Некрасов, генеральный директор «Контур Компонентс».
|
В основу разработки легла платформа Contour BI для сбора, хранения, публикации и анализа данных, позволяющая создавать мощные корпоративные или государственные аналитические системы без программирования в короткие сроки. OLAP-сервер Contour за минуты выполняет многомерные расчеты сценариев в разрезе регионов, десятков характеристик людей и видов мер помощи, отображая результаты в интерактивных информационных панелях – наглядных и простых для понимания. Для анализа в системе микромоделирования используются результаты проведенного Росстатом Выборочного наблюдения доходов населения и участия в социальных программах за 2021 год. Выбрав вид пособия в определенном регионе, можно увидеть, сколько людей его получает. И, наоборот, установив сложный фильтр по характеристикам определенной группы населения и выбрав критерии разрабатываемой меры поддержки, можно оценить , как предложенная мера повлияет на благосостояние людей.
Разрабатывая новые меры помощи определенной категории граждан в одном из регионов (например, матерям-одиночкам в Тюмени), эксперт может выяснить, какая доля представителей этой группы находится ниже границы бедности, каковы доходы этих людей, и насколько эффективной будет разрабатываемая мера поддержки. Предложив и сравнив разные сценарии (изменение размера существующих пособий или создание новых) и сопоставив их с возможностями бюджета, эксперты могут выбрать оптимальный вид помощи, который повысит уровень жизни граждан, объяснил Владимир Некрасов.
|
Реализация проекта заняла два года и обошлась в 10 миллионов рублей в 2020 году и 7 миллионов – в 2021-м. На июль 2022 года для апробации и последующего внедрения системы сформирована рабочая группа, в которую вошли представители Министерства труда и соцразвития, ВНИИ труда Минтруда России и Росстата.
2021
Использование Contour BI для обработки результатов переписи населения
В России завершился первый этап Всероссийской переписи населения (ВПН-2020, которая первоначально должна была пройти в 2020 г.). Формально было 99% от оценочной численности населения. Как пояснил глава Росстата Павел Малков, эта цифра получения путем прямого сложения из всех источников: от переписчиков, портала Госуслуг, специализированного контингента (военные части, тюрьмы) и административных данных (используются для дополнения собранной информации). Об этом стало известно 22 ноября 2021 года.
По словам Малкова, теперь собранная информация будет обрабатываться, в том числе с целью убрать дублирующие и «грязные» данные. Первые оперативные данные о численности населения будут опубликованы в конце января 2022 г., а полные итоги – до конца 2022 г.
ВПН-2020 стала первой переписью, при проведении которой использовались цифровые технологии. Переписчики вместо традиционных ходили с планшетами, также переписаться можно было с помощью Портала госуслуг.
Оператором цифровизации переписи был назначен «Ростелеком». Он закупил для переписчиков 360 тыс. планшетов, работающих на базе отечественной операционной системы «Аврора» (компания-разработчик «Аврора» также находится под контролем «Ростелекома»).(дайте линк на этот проект пжл)
Также Росстат применяет для проведения переписи систему бизнес-аналитики Contur-BI, лицензию на использованию которой ведомство приобрело у компании «Контур-Компонентс» за 16 млн руб. Система состоит из трех модулей. В первом модуле хранятся данные о подготовке к переписи, во втором – данные о ходе сбора сведений о населении, в третьем – визуальная информация о процессе обработки уже собранных материалов (как с помощью планшета, так и с помощью Портала госуслуг), в третьем модуле - визуальная информация о процессе обработки уже собранных материалов.
BI-система будет отвечать и за «очистку»у данных, полученных в ходе переписи. Наличие несколько источников информации и привело к задвоению полученных результатов: например, человек мог самостоятельно переписаться через пункты переписи, а его родственники переписать его через Портал госуслуг. Задача «очистки» полученных данных осложняется тем, что перепись была анонимна.
Очистка данных представляет из себя выявление и удаление дублей, заполнение пропущенных полей, исправление ошибок в типах данных (например, число содержит символ), исправление или удаление недостоверных значений (возраст составляет 999 лет или несуществующий адрес), - пояснил CNews гендиректор «Контур – Компонентс» Владимир Некрасов. - Большая часть таких ошибок не допускается программой ввода данных, для этого в ней есть правила формально-логистического контроля, но часть ошибок может быть выявлена только постконтролем. |
BI является конечным инструментом, в контексте очистки данных – это инструмент эксперта, в нем многие ошибки становятся видны мгновенное, например, неверные адреса, пустоты группируются и становятся очевидными с первого взгляда, - продолжил Некрасов. - Используя функционал матанализа (среднее квадратическое отклонение, дисперсия), можно выявлять аномальные отклонения. Также для контроля качества данных используются многомерные правила условного форматирования, когда неверные или подозрительные числа выделяются цветом или символом. |
По словам Владимира Некрасова, публикация результатов переписи будет выполняться несколькими способами: книги с множеством публикационных таблиц для вечного хранения, онлайн публикация итогов в интерактивных информационных панелях, микроданные для исследователей. BI платформа будет использована для публикации итогов в виде аналитических итогов и информационных панелей. В них итоги будут отображаться в виде интерактивных карт, графиков, разнообразных диаграмм. Это позволит пользователю быстро и глубоко понимать структуру и динамку населения страны во всех возможных разрезах[1].
Разработка концепции и настройка информационных панелей по ключевым социально-экономическим показателям
Компания Компания «Контур Компонентс» и Фонд «Бюро экономического анализа» подписали контракт по теме «Разработка концепции и настройка информационных панелей по ключевым социально-экономическим показателям на базе BI платформы Росстата». Об этом 21 июля 2021 года сообщили в «Контур Компонентс».
Консалтинговые услуги «Контур Компонентс» профинансирует Международный банк реконструкции и развития в рамках проекта «Развитие системы государственной статистики – 2». Работы будут выполнены в интересах Росстата.
В соответствии с контрактом «Контур Компонентс» разработает «Концепцию публикации ключевых социально-экономических показателей в виде информационных панелей, созданных на базе BI платформы Росстата» и действующий прототип интерактивных информационных панелей, публикующих основные социально-экономические показатели страны.
BI платформой Росстата с 2019 года является платформа Контур БиАй разработки компании «Контур Компонентс».
Росстат, как и все национальные статистические институты мира, публикует статистические данные в форме Excel таблиц, PDF файлов, статических HTML страниц. Развитие информационных технологий, навыков пользователей статистики требует перехода к интерактивным информационным панелям, объединяющим многомерные вычисления на основе OLAP-технологий, высокую интерактивность и богатую визуализацию данных.
Использование для публикации данных BI технологий и развитие таких методов публикации данных позволит пользователям повысить качество работы с официальной статистикой, предоставлять органам государственного управления и гражданскому обществу данные в наглядной визуальной форме с использованием современных методов визуализации, с возможностью выполнения анализа данных, реализации разнообразных запросов, обобщения и детализации данных.