Smart Engines: MIDV-DM Датасет поддельных документов

Продукт
Разработчики: Smart Engines (Смарт Энджинс)
Дата премьеры системы: 2025/12/02
Технологии: Big Data,  ИБ - Система обнаружения мошенничества (фрод)

Основная статья: Большие данные (Big Data)

2025: Выпуск MIDV-DM

Smart Engines выпустила специализированный датасет поддельных документов для разработчиков ИИ - MIDV-DM. Об этом компания сообщила 2 декабря 2025 года.

Решение включает 8 тыс. изображений с удостоверениями личности РФ, СНГ и других стран. Вошедшие в набор образцы были изготовлены с помощью наиболее распространенных у мошенников методов подделки. Датасет позволит разработчикам со всего мира обучать, тестировать и совершенствовать антифрод-системы на базе ИИ.

MIDV-DM стал публичным датасетом, который систематизировал все основные способы манипуляций с документами. В основу набора легла 1 тыс. изображений из ранее опубликованной исследователями Smart Engines выборки MIDV-2020: образцы внутреннего паспорта РФ, национальные паспорта и ID-карты Азербайджана, Латвии, Эстонии, Финляндии и других. Разработчики использовали такие манипуляции с документами, как вставка текстовых полей или фото из «донорского» документа, «маскирование» отдельных полей документа, склеивание разных фрагментов в один образ, вставка посторонних объектов – эмблем, голограмм и др.

Набор данных позволяет разработчикам повышать точность антифрод-решений. Это особенно актуально на фоне участившихся случаев мошенничества с поддельными документами – в России число уголовных дел по фальсификации, изготовлению и обороту подделок (ст. 327 УК РФ) увеличилось на 34% и составило 3,9 тыс. в 2024 году. Такие данные представлены в ежегодном исследовании специалистов Smart Engines и юридической фирмы INTELLECT.

«
При создании MIDV-DM мы сознательно вышли за рамки сценариев с текстовыми манипуляциями, детекция которых уже не является проблемой для современных систем. В датасет вошли подделки с изменением подписи, фотографии держателя и отдельных полей документа – то есть полный спектр типичных атак, с которыми на практике сталкиваются банки, МФО и госструктуры. Это позволит ИИ-системам учиться с повышенной точностью видеть не только замененные ФИО, но и сложные структурные несоответствия в документе, – отмечает Владимир Арлазаров, генеральный директор Smart Engines, доктор технических наук.
»

В дальнейшем с помощью MIDV-DM Smart Engines планирует развивать собственную антифрод-систему «Шерлок 2о» – мультимодальную ИИ-модель, способную одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, текстовыми полями, данными NFC-чипа, штрих-кодами, метаданными и сигнатурами. В общей сложности система проверяет документ на подлинность по 600 параметрам.



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год

  БизнесАвтоматика НПЦ (123)
  Большая Тройка (46)
  Сбербанк (16)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (604)

  БизнесАвтоматика НПЦ (4)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс.Облако (Yandex Cloud) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (62)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  Retail Rocket (Ритейл Рокет) (2)
  Arenadata (Аренадата Софтвер) (2)
  Университет Иннополис (2)
  Другие (76)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (6)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Цифра (2)
  Другие (91)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год

  БизнесАвтоматика НПЦ (3, 122)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 13)
  Цифра (2, 12)
  Другие (319, 168)

  РИР (Росатом Инфраструктурные решения) (3, 4)
  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Цифра (1, 2)
  Другие (18, 19)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  DataCatalog (ДатаКаталог) (1, 3)
  Luxms (1, 3)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (19, 22)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (2, 2)
  Цифра (1, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Luxms (1, 2)
  Другие (10, 11)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год

  Visary BI Платформа бизнес-аналитики - 122 (122, 0)
  Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 36 (0, 36)
  Триафлай BI-платформа - 13 (13, 0)
  ZIIoT Платформа для работы с промышленными данными - 12 (12, 0)
  Другие 93

  Росатом Цифровое ресурсоснабжение - 4 (1, 3)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 4 (0, 4)
  Visary BI Платформа бизнес-аналитики - 4 (4, 0)
  CM.Expert Data Mining платформа - 2 (2, 0)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Другие 5

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 7 (0, 7)
  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Arenadata Catalog - 3 (3, 0)
  Luxms BI - 3 (3, 0)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Другие 3

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 5 (0, 5)
  Росатом Цифровое ресурсоснабжение - 2 (1, 1)
  Data Ocean Nova Платформа данных - 2 (2, 0)
  Luxms BI - 2 (2, 0)
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Солар (Solar) (20)
  SearchInform (СёрчИнформ) (18)
  Национальное бюро кредитных историй (НБКИ) (16)
  Инфосистемы Джет (9)
  Experian (8)
  Другие (172)

  SearchInform (СёрчИнформ) (3)
  Positive Technologies (Позитив Текнолоджиз) (1)
  R-Vision (Р-Вижн) (1)
  RBK Money (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Другие (3)

  SearchInform (СёрчИнформ) (8)
  Positive Technologies (Позитив Текнолоджиз) (3)
  БПС Инновационные программные решения (ранее БПЦ Банковские технологии) (2)
  R-Vision (Р-Вижн) (1)
  Softline (Софтлайн) (1)
  Другие (2)

  Positive Technologies (Позитив Текнолоджиз) (3)
  R-Vision (Р-Вижн) (2)
  SearchInform (СёрчИнформ) (2)
  Солар (Solar) (2)
  Smart Engines (Смарт Энджинс) (1)
  Другие (6)

Данные не найдены

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Visa International (4, 27)
  Инфосистемы Джет (5, 25)
  Солар (Solar) (2, 22)
  SearchInform (СёрчИнформ) (2, 19)
  FICO (4, 18)
  Другие (194, 155)

  SearchInform (СёрчИнформ) (1, 3)
  Positive Technologies (Позитив Текнолоджиз) (1, 1)
  Лаборатория Касперского (Kaspersky) (1, 1)
  R-Vision (Р-Вижн) (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (1, 1)

  SearchInform (СёрчИнформ) (1, 9)
  Positive Technologies (Позитив Текнолоджиз) (1, 3)
  БПС Инновационные программные решения (ранее БПЦ Банковские технологии) (1, 2)
  Лаборатория Касперского (Kaspersky) (1, 1)
  R-Vision (Р-Вижн) (1, 1)
  Другие (0, 0)

  Positive Technologies (Позитив Текнолоджиз) (1, 7)
  R-Vision (Р-Вижн) (2, 2)
  SearchInform (СёрчИнформ) (1, 2)
  Солар (Solar) (1, 2)
  Динамика (Dynamika) Новосибирск (1, 1)
  Другие (2, 2)

Данные не найдены

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2023 год
2024 год
2025 год
Текущий год

  3-D Secure (3D-Secure) - 27 (23, 4)
  Solar inView ранее Jet inView Security (JiVS) - 19 (0, 19)
  СёрчИнформ SIEM - 19 (19, 0)
  НБКИ-AFS (Anti-Fraud Service) - 12 (12, 0)
  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 11 (11, 0)
  Другие 117

  СёрчИнформ SIEM - 3 (3, 0)
  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 1 (1, 0)
  Solar AURA (Audit & Risk Assessment) - 1 (1, 0)
  ЦРТ:VoiceKey.Platform - 1 (1, 0)
  Kaspersky Anti Targeted Attack Platform (KATA) - 1 (1, 0)
  Другие 0

  СёрчИнформ SIEM - 9 (9, 0)
  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 3 (3, 0)
  БПС: СмартВиста Система предотвращения мошенничества - 2 (2, 0)
  Kaspersky Anti Targeted Attack Platform (KATA) - 1 (1, 0)
  Другие 0

  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 7 (7, 0)
  Solar AURA (Audit & Risk Assessment) - 2 (2, 0)
  СёрчИнформ SIEM - 2 (2, 0)
  Kaspersky Anti Targeted Attack Platform (KATA) - 1 (1, 0)
  R-Vision Threat Intelligence Platform (TIP) - 1 (1, 0)
  Другие 2
Данные не найдены