Инфраструктура научно-исследовательских данных (ИНИД)

Продукт
Разработчики: ЦПУР - Центр перспективных управленческих решений, Счетная Палата РФ
Дата премьеры системы: 2020/10/02
Дата последнего релиза: 2021/03/05
Отрасли: Государственные и социальные структуры,  Интернет-сервисы,  Образование и наука

Содержание

Основная статья: База данных

2021: Доступность данных о рынке труда в России в период пандемии

1 марта 2021 года "Центр перспективных управленческих решений" сообщил о том, что данные о рынке труда в России в период пандемии стали доступны для научного анализа.

Данные о рынке труда в России в период пандемии стали доступны для научного анализа

В период с апреля по октябрь 2020 года Роструд собрал большой массив данных со сведениями об основных признаках 2 996 807 соискателей, обратившихся за пособием по безработице через портал "Работа в России".

Данные были деперсонифицированы и опубликованы для научного анализа и исследовательских целей на платформе ИНИД. Набор состоит из 65 атрибутов, которые содержат общие характеристики граждан, сведения о факте осуществления трудовой деятельности в соответствующем календарном месяце, сведения из резюме, информация о выплатах, даты и связанные с ними статусы заявлений. Данные не агрегированы, что позволяет получить более четкое представление об изменениях на рынке труда в указанный промежуток времени.

Также на платформе доступен один из первых в России наборов данных, содержащих деперсонифицированные административные микроданные о соискателях государственной услуги по содействию в поиске подходящей работы, которую предоставляют центры занятости. Дата-сет охватывает период с 2017 по 2020 год. Всего набор содержит 18 053 738 наблюдений по 53 атрибутам.

Единица наблюдения в наборе – это отдельное личное дело. Для каждого из них представлены такие показатели, как общие характеристики соискателя, его трудовой статус гражданина, действия, предпринятые службами занятости, данные о трудоустройстве по направлению, информация о работе с гражданином, информация о том, к каким категориям граждан, испытывающих трудности с поиском работы относится соискатель.

Оба набора представлены в формате CSV-таблицы и доступны в "продвинутом" режиме доступа каталога платформы ИНИД через виртуальные рабочие машины.[1]

2020: Запуск платформы

2 октября 2020 года стало известно, что Центр перспективных управленческих решений в партнерстве со Счетной палатой РФ запустили платформу, которая позволит исследователям оптимизировать процесс работы с данными российских ведомств. Проект предназначен для всех, кто проводит исследования в области общественных наук и испытывает затруднения при работе с государственными данными.

Цель создания платформы «Инфраструктура научно-исследовательских данных» (ИНИД) ― облегчить взаимодействие между представителями научно-исследовательского сообщества и органами государственной власти. Обратившись к каталогу ИНИД, пользователи смогут ознакомиться с представленными на сайте наборами данных, например, с базой данных муниципальных образований РФ и базой данных проекта «Госрасходы» Счетной палаты РФ. На платформе на октябрь 2020 года представлены данные, полученные от Росстата, Министерства финансов, Федеральной налоговой службы и других органов власти. Платформа открыта для присоединения для органов власти и исследователей.

В дальнейшем каталог будет пополняться дополнительными наборами данных от федеральных и региональных органов власти. Как пояснил директор Департамента цифровой трансформации Счетной палаты РФ Михаил Петров:

«
предоставление исследователям государственных данных, их большая доступность отвечают целям Счетной палаты, среди которых ― повышение прозрачности системы госуправления. Проект ИНИД – это один из инструментов, с помощью которых будет возможно повысить значимость больших данных при принятии важных управленческих решений.
»

По мнению генерального директора Центра перспективных управленческих решений Марии Шклярук, для развития культуры принятия решений на основе данных необходимы прежде всего сами данные, представленные в удобном для работы виде.

«
Многие исследователи, уже работающие с государственными данными, отмечают сложность в получении доступа к необходимой информации, неудобный формат, отсутствие системы и методологии в подаче, ― отмечает Мария Шклярук. ― Несмотря на то, что органы государственной власти выкладывают много данных в открытый доступ, эти данные в большинстве случаев представлены бессистемно и обрывочно. Работать с таким сырым материалом сложно: для того, чтобы использовать его в исследованиях, необходимо дополнительно обрабатывать данные, это требует много времени и усилий.
»

Именно для решения этой проблемы была запущена платформа «Инфраструктура научно-исследовательских данных», с помощью которой исследователи смогут оптимизировать процесс работы с официальными данными. На платформе будут представлены достоверные неагрегированные данные, предоставленные непосредственно ведомствами и обработанные специалистами по данным. Органы власти могут использовать платформу для получения обратной связи на свои наборы данных, а также использовать ее для поиска исследователей для некоммерческого взаимодействия.

В целях расширения возможностей научного сообщества при работе с данными доступ к платформе предоставляются исследователям и госорганам бесплатно.

Зарегистрироваться на платформе «Инфраструктура научно-исследовательских данных» можно по адресу data-in.ru/ru/

Ссылки

Ссылка на платформу

Примечания