| Разработчики: | Beorg (Биорг) |
| Дата последнего релиза: | 2026/03/13 |
| Технологии: | СЭД, СЭД - Системы потокового распознавания |
Содержание |
2026: Распознавание рукописного шрифта
Нейросеть компании "Биорг" видит рукописные символы, подобно человеку: воспринимает на изображении всю информацию сразу, а не поэтапно. Такой подход обеспечивает точность на уровне от 80% даже для распознавания «шумных» рукописных данных в штампе регистрации паспорта, без видеокарт (GPU). Технологию можно масштабировать для оцифровки и других типов документов. Об этом «Биорг» сообщил 13 марта 2026 года.
На первом этапе нейросеть научили понимать рукописный текст в простых строках, а затем «читать» сложный и «шумный» текст, где рукописные символы чередуются с печатными. В результате модель за 3-4 секунды обнаруживает признаки символов, понимает их вектор и декодирует его. Таким образом, на любом рукописном фрагменте ИИ распознает данные с полнотой и точностью (accuracy) на уровне 80 процентов, вне зависимости от типа документа.
Нейросеть тренировали на открытых массивах и собственном наборе данных «Биорг» с применением реальных и синтетических изображений – всего потребовалось более 30 тыс. фрагментов рукописных данных. Дополнительное обучение даст возможность поднять показатель точности выше 90%.
| | Технология актуальна не только для распознавания штампов регистраций в паспорте, но и для автоматической оцифровки рукописных фрагментов справок, трудовых книжек, военных билетов и других форм в бизнес-процессах банков, страховых компаний и других корпоративных заказчиков. Следующий шаг - мы перенесём доработку из SaaS-версии в «коробочный» вариант нашего ПО «Биорг.Документы». Качественное распознавание рукописных данных – очередная веха на пути непрерывных улучшений, которого мы придерживаемся, - сказал генеральный директор «Биорг» Руслан Алигаджиев. | |
Проблема распознавания рукописных данных традиционно заключается в отсутствии единого стиля написания букв. В штампе регистрации паспорта ситуация усугубляется наличием «шума»: вперемешку с рукописным встречается печатный текст, расстояние между строками варьируется, отсутствует геометрическая последовательность, нет единообразия написания адресов, - всё это драматически влияет на качество распознавания.
В отличии от классических подходов, где нужно определить тип документа, довернуть его, превратить слова в строки и распознать их, нейросеть «Биорг» воспринимает изображение как цельный набор данных (end-to-end).
2024: Отказ правительства выделить средства на создание продукта
В середине января 2024 года стало известно о том, что из дорожной карты «Новое общесистемное ПО» исключены два проекта по разработке софта с функциями оптического распознавания документов (OCR). Речь идет о создании аналогов продуктов серии FineReader компании ABBYY, которая покинула российский рынок в связи со сложившейся геополитической обстановкой. Общая стоимость отклоненных проектов должна была превысить 0,5 млрд рублей.
Как сообщает CNews, государство отказалось финансировать продукты «Биорг.Документы» и Easydoc. Первый, как ожидалось, компания «Биорг» создаст по заказу «Ростелекома». Планировалась разработка кроссплатформенного решения для оцифровки документов и распознавания изображений в интересах государственных и корпоративных заказчиков. В свою очередь, Easydoc компании ITFB («АйТиЭфБи Дистрибьюшн») позиционировался как платформа интеллектуальной обработки документов, извлекающая данные на основе технологий искусственного интеллекта. Затраты только на создание Easydoc оценивались в 512 млн рублей.
Директор по взаимодействию с органами государственной власти «Биорг» Илья Веригин сообщил, что компания вместе с «Ростелекомом» приблизилась к одобрению проекта «Биорг.Документы» в рамках центра компетенций разработки (ЦКР), но затем возникли неопределенности. Дело в том, что премьер-министр Михаил Мишустин поручил расставить приоритеты в пользу отраслевых информационных систем, которые критически важны для управления предприятиями. В результате, произошла переориентация ЦКР на промышленное ПО, а «Ростелеком» отозвал свой заказ на «Биорг.Документы».
| | В такой ситуации мы решили уйти от идеи ABBYY-замещения и сосредоточиться на изначальной концепции нашей платформы, — говорит Веригин. | |
Весте с тем в ITFB сообщили, что на фоне отказа государства от финансирования Easydoc компания намерена развивать данный продукт за счет собственных средств и за счет средств Фонда содействия инновациями.[1]







