Smart Engines: MIDV-DM Датасет поддельных документов

Продукт
Разработчики: Smart Engines (Смарт Энджинс)
Дата премьеры системы: 2025/12/02
Технологии: Big Data,  ИБ - Система обнаружения мошенничества (фрод)

Основная статья: Большие данные (Big Data)

2025: Выпуск MIDV-DM

Smart Engines выпустила специализированный датасет поддельных документов для разработчиков ИИ - MIDV-DM. Об этом компания сообщила 2 декабря 2025 года.

Решение включает 8 тыс. изображений с удостоверениями личности РФ, СНГ и других стран. Вошедшие в набор образцы были изготовлены с помощью наиболее распространенных у мошенников методов подделки. Датасет позволит разработчикам со всего мира обучать, тестировать и совершенствовать антифрод-системы на базе ИИ.

MIDV-DM стал публичным датасетом, который систематизировал все основные способы манипуляций с документами. В основу набора легла 1 тыс. изображений из ранее опубликованной исследователями Smart Engines выборки MIDV-2020: образцы внутреннего паспорта РФ, национальные паспорта и ID-карты Азербайджана, Латвии, Эстонии, Финляндии и других. Разработчики использовали такие манипуляции с документами, как вставка текстовых полей или фото из «донорского» документа, «маскирование» отдельных полей документа, склеивание разных фрагментов в один образ, вставка посторонних объектов – эмблем, голограмм и др.

Набор данных позволяет разработчикам повышать точность антифрод-решений. Это особенно актуально на фоне участившихся случаев мошенничества с поддельными документами – в России число уголовных дел по фальсификации, изготовлению и обороту подделок (ст. 327 УК РФ) увеличилось на 34% и составило 3,9 тыс. в 2024 году. Такие данные представлены в ежегодном исследовании специалистов Smart Engines и юридической фирмы INTELLECT.

«
При создании MIDV-DM мы сознательно вышли за рамки сценариев с текстовыми манипуляциями, детекция которых уже не является проблемой для современных систем. В датасет вошли подделки с изменением подписи, фотографии держателя и отдельных полей документа – то есть полный спектр типичных атак, с которыми на практике сталкиваются банки, МФО и госструктуры. Это позволит ИИ-системам учиться с повышенной точностью видеть не только замененные ФИО, но и сложные структурные несоответствия в документе, – отмечает Владимир Арлазаров, генеральный директор Smart Engines, доктор технических наук.
»

В дальнейшем с помощью MIDV-DM Smart Engines планирует развивать собственную антифрод-систему «Шерлок 2о» – мультимодальную ИИ-модель, способную одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, текстовыми полями, данными NFC-чипа, штрих-кодами, метаданными и сигнатурами. В общей сложности система проверяет документ на подлинность по 600 параметрам.



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  БизнесАвтоматика НПЦ (123)
  Большая Тройка (46)
  Сбербанк (16)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (589)

  БизнесАвтоматика НПЦ (12)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Мобильные ТелеСистемы (МТС) (2)
  Mains Lab (Мэйнс Лаборатория) (2)
  Другие (43)

  БизнесАвтоматика НПЦ (4)
  РИР (Росатом Инфраструктурные решения) (3)
  CM.Expert (АвтоЭксперт) (2)
  Сбер Бизнес Софт (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (62)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  Retail Rocket (Ритейл Рокет) (2)
  TData (ТДата) (2)
  Наносемантика (Nanosemantics Lab) (2)
  Другие (76)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (5)
  Ростелеком (3)
  Цифровые технологии и платформы (ЦТиП) (3)
  РИР (Росатом Инфраструктурные решения) (2)
  Другие (80)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  БизнесАвтоматика НПЦ (3, 122)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 13)
  Цифра (2, 12)
  Другие (313, 163)

  БизнесАвтоматика НПЦ (1, 12)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Yabbi (Ябби) (1, 1)
  Другие (9, 9)

  РИР (Росатом Инфраструктурные решения) (3, 4)
  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Цифра (1, 2)
  Другие (18, 19)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  DataCatalog (ДатаКаталог) (1, 3)
  Luxms (1, 3)
  Цифра (1, 2)
  Другие (19, 22)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (2, 2)
  Цифра (1, 2)
  Luxms (1, 1)
  Smart Engines (Смарт Энджинс) (1, 1)
  Другие (8, 8)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 122 (122, 0)
  Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 35 (0, 35)
  Триафлай BI-платформа - 13 (13, 0)
  ZIIoT Платформа для работы с промышленными данными - 12 (12, 0)
  Другие 90

  Visary BI Платформа бизнес-аналитики - 12 (12, 0)
  Росатом Цифровое ресурсоснабжение - 3 (1, 2)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  Дата-Центр Автоматика: Expert Base Аналитическая платформа - 1 (1, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Другие 3

  Росатом Цифровое ресурсоснабжение - 4 (1, 3)
  Visary BI Платформа бизнес-аналитики - 4 (4, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  Arenadata Catalog - 2 (2, 0)
  CM.Expert Data Mining платформа - 2 (2, 0)
  Другие 7

  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 7 (0, 7)
  Visary BI Платформа бизнес-аналитики - 5 (5, 0)
  Luxms BI - 3 (3, 0)
  Arenadata Catalog - 3 (3, 0)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Другие 3

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 4 (0, 4)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Росатом Цифровое ресурсоснабжение - 2 (1, 1)
  Luxms BI - 1 (1, 0)
  Другие -2

Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Солар (Solar) (20)
  SearchInform (СёрчИнформ) (18)
  Национальное бюро кредитных историй (НБКИ) (16)
  Инфосистемы Джет (9)
  Experian (8)
  Другие (172)

  Солар (Solar) (3)
  SearchInform (СёрчИнформ) (2)
  VisionLabs (ВижнЛабс) (1)
  Диасофт (Diasoft) (1)
  Динамика (Dynamika) Новосибирск (1)
  Другие (0)

  SearchInform (СёрчИнформ) (3)
  Ростелеком (1)
  Солар (Solar) (1)
  Positive Technologies (Позитив Текнолоджиз) (1)
  R-Vision (Р-Вижн) (1)
  Другие (3)

  SearchInform (СёрчИнформ) (8)
  Positive Technologies (Позитив Текнолоджиз) (3)
  БПС Инновационные программные решения (ранее БПЦ Банковские технологии) (2)
  Нева-Автоматизация (1)
  R-Vision (Р-Вижн) (1)
  Другие (2)

  Positive Technologies (Позитив Текнолоджиз) (3)
  Солар (Solar) (2)
  R-Vision (Р-Вижн) (2)
  SearchInform (СёрчИнформ) (2)
  Динамика (Dynamika) Новосибирск (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Visa International (4, 27)
  Инфосистемы Джет (5, 25)
  Солар (Solar) (2, 22)
  SearchInform (СёрчИнформ) (2, 19)
  FICO (4, 18)
  Другие (193, 155)

  Солар (Solar) (1, 3)
  SearchInform (СёрчИнформ) (1, 2)
  Диасофт (Diasoft) (1, 1)
  VisionLabs (ВижнЛабс) (1, 1)
  Динамика (Dynamika) Новосибирск (1, 1)
  Другие (0, 0)

  SearchInform (СёрчИнформ) (1, 3)
  Лаборатория Касперского (Kaspersky) (1, 1)
  R-Vision (Р-Вижн) (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Солар (Solar) (1, 1)
  Другие (1, 1)

  SearchInform (СёрчИнформ) (1, 9)
  Positive Technologies (Позитив Текнолоджиз) (1, 3)
  БПС Инновационные программные решения (ранее БПЦ Банковские технологии) (1, 2)
  Лаборатория Касперского (Kaspersky) (1, 1)
  R-Vision (Р-Вижн) (1, 1)
  Другие (0, 0)

  Positive Technologies (Позитив Текнолоджиз) (1, 7)
  R-Vision (Р-Вижн) (2, 2)
  SearchInform (СёрчИнформ) (1, 2)
  Солар (Solar) (1, 2)
  Динамика (Dynamika) Новосибирск (1, 1)
  Другие (2, 2)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2022 год
2023 год
2024 год
Текущий год

  3-D Secure (3D-Secure) - 27 (23, 4)
  Solar inView ранее Jet inView Security (JiVS) - 19 (0, 19)
  СёрчИнформ SIEM - 19 (19, 0)
  НБКИ-AFS (Anti-Fraud Service) - 12 (12, 0)
  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 11 (11, 0)
  Другие 117

  Solar inView ранее Jet inView Security (JiVS) - 3 (0, 3)
  СёрчИнформ SIEM - 2 (2, 0)
  VisionLabs Luna Pass - 1 (1, 0)
  Dynamika-Финансовый мониторинг - 1 (1, 0)
  Другие -3

  СёрчИнформ SIEM - 3 (3, 0)
  Kaspersky Anti Targeted Attack Platform (KATA) - 1 (1, 0)
  R-Vision Threat Intelligence Platform (TIP) - 1 (1, 0)
  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 1 (1, 0)
  Solar AURA (Audit & Risk Assessment) - 1 (1, 0)
  Другие 0

  СёрчИнформ SIEM - 9 (9, 0)
  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 3 (3, 0)
  БПС: СмартВиста Система предотвращения мошенничества - 2 (2, 0)
  R-Vision VM - 1 (1, 0)
  Другие 0

  Positive Technologies: MaxPatrol VM (Vulnerability Management) - 7 (7, 0)
  СёрчИнформ SIEM - 2 (2, 0)
  Solar AURA (Audit & Risk Assessment) - 2 (2, 0)
  Dynamika-Финансовый мониторинг - 1 (1, 0)
  R-Vision VM - 1 (1, 0)
  Другие 2