Федеральная кадастровая палата объявила тендер на создание модульной системы машинного обучения
Заказчики: Федеральная кадастровая палата Росреестра Москва; Государственные и социальные структуры Продукт: Искусственный интеллект (ИИ, Artificial intelligence, AI)Дата проекта: 2021/09
Бюджет проекта: 36 000 000 руб.
|
Технология: Data Mining
Технология: Data Quality - Качество данных
Технология: Робототехника
|
2021: Тендер на создание модульной системы машинного обучения
23 сентября 2021 года стало известно о том, что Федеральная кадастровая палата в составе Федеральной службы государственной регистрации, кадастра и картографии (Росреестр) готова потратить до 36 млн руб. на создание модульной системы машинного обучения (МСМО) в рамках оптимизации государственного кадастрового учета и госрегистрации прав на недвижимость.
Данная сумма выставлена в качестве начальной максимальной цены контракта в тематическом тендере Кадастровой палаты, который был запущен 20 сентября 2021 г. в формате открытого конкурса. Заявки от претендентов будут приниматься до 12 октября 2021 года, подведение итогов намечено на 18 октября. Фронт работ рассчитан на срок до 15 декабря 2021 г.
При разработке МСМО должно использоваться ПО из Единого реестра российского софта при Минцифры или относящееся к программам с открытым исходным кодом.
В ходе проекта подрядчику предстоит создать интеллектуальную систему поддержки принятия решений людьми с использованием нейросетевых технологий. Таким образом будет автоматизирован процесс оказания профильных госуслуг Росреестра для граждан.
В частности, чиновники рассчитывают добиться минимизации ручных операции пользователей федеральной госинформсистемы единого государственного реестра недвижимости (ФГИС ЕГРН) в учетно-регистрационной сфере, снижения числа возможных ошибок, связанных с выполнением повторяющихся рутинных пользовательских операций, сокращения срока обработки документов при оказании госуслуг за счет использования нейросетевых методов обработки естественного языка.
Также по тогам проекта должны произойти повышение доступности сведений, содержащихся в поступающих документах, за счет использования механизма компьютерного зрения, переход к формату машиночитаемых данных на этапе предварительной проверки документов, унификация процесса обработки документов.
В соответствии с ТЗ, выполнение работ по созданию МСМО должно проводиться на тестовой копии ФГИС ЕГРН, предоставляемой заказчиком.
В создаваемой МСМО должна выполняться классификация поступающих документов (определение их типа). МСМО должна выполнять нормализацию геометрии изображения — правильно его ориентировать. Применяемые методики должны работать с точностью определения исходной ориентации, превосходящей 99,9%. На основании нормализации геометрии изображения отсканированного документа должно производиться улучшение работы алгоритма сегментации. В МСМО должно быть реализовано распознавание различных шрифтов.
В МСМО должны быть применены нейросетевые методы обработки естественного языка, основанные на последних разработках в области семантического анализа и выделения именованных сущностей (NER), алгоритмические методы (регулярные выражения) на соответствие принятым «маскам», например серия, № паспорта, кадастровый номер.
МСМО должна различать данные субъектов учетно-регистрационного действия, объектов недвижимости, в отношении которых совершаются учетно-регистрационные действия, а также иных существенных и других условий сделки в соответствии с разработанными алгоритмами из скан-образов представленных документов и файлов заявлений в формате XML.
В МСМО должен быть реализован механизм получения сведений проверок на читаемость, отсутствие приписок и правок, наличие подписей и/или печатей, а также механизм компьютерного зрения с возможностью визуального определения сущностей в документах из загруженного пакета.
МСМО должна обеспечивать автоматизированное сопоставление и анализ соответствия содержания документов сведениям ЕГРН и сведениям, указанным в поступившем в составе пакета документов заявлении.
По результатам обучения на минимальном предоставленном заказчиком наборе данных МСМО на этапе предварительных испытаний должна обеспечить значение совокупного показателя accuracy (точность) — рассчитывается как отношение найденных единиц именованных сущностей ко всему количеству единиц сущностей в тексте — на уровне не менее 60%.
МСМО должна обеспечить возможность повышения качества распознавания данных за счет обучения в процессе эксплуатации. По результатам опытной эксплуатации исполнитель должен предоставить заказчику план поэтапного доведения совокупного показателя accuracy нейросетей искусственного интеллекта до целевых значений 70, 80, 90, 95% с указанием необходимых объемов формирования обучающих наборов данных[1].