Название базовой системы (платформы): | Искусственный интеллект (ИИ, Artificial intelligence, AI) |
Разработчики: | Beorg (Биорг) |
Дата последнего релиза: | 2024/10/31 |
Технологии: | СЭД - Системы потокового распознавания |
Содержание |
Beorg Smart Vision – решение по оцифровке архивов и распознаванию документов. По словам разработчиков, программа позволяет обрабатывать комплекты (включая даже рукописные документы) в срок до 20 минут.
Beorg Smart Vision – гибкое и универсальное решение, которое масштабируется под любые задачи и объем данных. При этом для запуска проекта заказчику не требуется закупать дорогостоящее оборудование и лицензии, а также привлекать дополнительных специалистов — скан-образы документов проходят обработку, верификацию и классифицируются в защищенном облаке на стороне «Биорг». Даже «сложные» массивы данных (рукописный текст, смазанные печати, ветхие и нечеткие записи с персональными данными), в отличие от «коробочных» OCR-продуктов, Beorg Smart Vision умеет распознавать и переводить в электронный вид автоматически. Это минимизирует влияние «человеческого» фактора на качество оцифровки, а ее точность достигает 99,9%, что является абсолютным максимумом для рынка.
2024: Нейросеть в 4 раза быстрее распознает и проверяет паспорт РФ
Обновленную технологию 31 октября 2024 года представила компания «Биорг». Улучшенная нейросеть в 4,25 раза быстрее и в 8 раз точнее своей предыдущей модели распознает поле паспорта с машиночитаемой записью (МЧЗ, MRZ). Это помогает контролировать качество обработки всех данных в документе и в автоматическом режиме проверять паспорт на актуальность. Скорость и точность важны при [[ОКБ: Экспресс Скоринг Кредитный скоринг|скоринге кредитных заявок]] в банках, МФО, при оформлении договора в страховых компаниях и т.д.
Особенность данной нейросетевой модели в том, что ИИ не пытается локализовать данные, и распознать отдельные символы в строке. Сеть находит и считывает сразу всю информацию, подобно тому, как это делает человеческий глаз. Модель понимает, что справилась с распознаванием хорошо в ходе многоэтапной постобработки - по количеству распознанных символов, по содержанию строки и т.д. Такая проверка занимает доли секунды.
Одно из качеств подхода в том, что он может быть масштабирован на другие типы документов. Модель может работать не только на графических ускорителях (видеокартах), но и на обычных процессорах. Это делает процесс распознавания более экономичным с точки зрения расходов на инфраструктуру. И даже более экологичным, если учитывать, сколько электроэнергии поглощают видеокарты и сколько тепла они выделяют в дата-центрах. – сказал генеральный директор «Биорг» Руслан Алигаджиев. |
Нейросеть хорошо справляется даже с документами, фото которых сделано в условиях недостатка или избытка освещения, а также с изображениями документов, сфотографированных под углом, с геометрическими искажениями. Традиционно такие изображения вызывали проблемы при обработке. Точность распознавания строки МЧЗ составляет более 99%.
2023: Применение в приложении «Моя смена»
Благодаря технологиям искусственного интеллекта (ИИ) пользователи платформы «Моя смена» - приложения для быстрого поиска подработки рядом с домом - могут до 20 раз быстрее зарегистрировать аккаунт и выйти на смену в магазины крупных торговых сетей. Для этого необходимо загрузить паспорт и медицинскую книжку. Документы распознает и проверяет ИИ-технология Beorg Smart Vision от российской компании «Биорг». Благодаря решению больше не нужно заносить данные вручную, а торговые сети получают уверенность в подлинности документов временных исполнителей. Об этом Beorg сообщил 29 августа 2023 года. Подробнее здесь.
2021: Оптимизация нейросетевого «конвейера» для автоматического распознавания паспортов
Российская компания «Биорг», резидент Сколково, разработчик отечественной платформы для потоковой оцифровки документов Beorg Smart Vision, 22 июля 2021 года сообщила об оптимизации нейросетевого «конвейера» для автоматического распознавания паспортов. По данным компании, время обработки одного разворота паспорта составляет не более 2 секунд при одновременной работе с потоком документов, качество распознания – выше 99%.
Доработку нейросетей провели на средства гранта «Стратегические компьютерные технологии и программное обеспечение» от фонда «Сколково». Сумма гранта — пять миллионов рублей.
Расчетная пропускная способность обновлённой платформы выросла в два раза. Система автоматически распознаёт не менее 95% полей, содержащих информацию, изначально этот показатель не превышал 50-60%. Оставшиеся 5% неуверенно распознанных системой полей верифицируются вручную операторами ввода данных, что повышает качество итоговой обработки почти до ста процентов.
«Мы используем сервисный подход, где акцент делаем на итоговый результат: высокое качество цифровых документов и возможность сэкономить бюджет заказчика. Гибридная платформа Beorg Smart Vision – это SaaS-решение, для потоковой оцифровки не только паспортов, но и практически всех видов документов, в том числе рукописных. Тот объём информации, с которым не справляются нейросети, обрабатывают наши операторы. Подобный контроль необходим при оцифровке архивов, чертежей, в банковских ипотечных «конвейерах» и т. д., — везде, где нужна точность. Совмещая технологический подход с возможностями краудсорсинга, мы оцифровываем даже некачественные скан-изображения, сделанные при недостаточном освещении, с бликами и т.д., что обычно представляет проблемы для систем автоматического распознавания», — рассказал основатель «Биорг» Георгий Зуев. |
2020
Признание важной и достойной для тиражирования по стране
Интеллектуальная платформа Beorg Smart Vision, предназначенная для распознавания объектов и данных с помощью технологий искусственного интеллекта, признана важной и достойной для тиражирования по стране. Такую оценку разработка компании «Биорг» получила от Агентства стратегических инициатив (АСИ) в рамках конкурса Smart.AI&Data. В ноябре 2020 года в беседе с TAdviser основатель «Биорг» Георгий Зуев рассказал о том, как сфера госинформатизации становится площадкой, где массово внедряются самые передовые технологические и организационные решения. Подробнее здесь.
Масштабирование системы оцифровки документов Beorg Smart Vision на базе платформы Mail.ru Cloud Solutions
12 мая 2020 года компания «Биорг» сообщила, что перенесла свои сервисы по распознаванию сложных объектов и данных, включая рукописный текст на облачную платформу Mail.ru Cloud Solutions (MCS). Платформа обеспечит конфиденциальность, скорость обработки и передачи информации, а также возможность быстрого масштабирования сервисов Beorg Smart Vision. Подробнее здесь.
Расширении функционала платформы с учетом востребованности формата удаленной работы
14 апреля 2020 года компания «Биорг», российский разработчик интеллектуальных систем на базе нейронных сетей и машинного обучения, сообщила о расширении функционала своей краудсорсинговой платформы с учетом изменения формата работы большинства коммерческих и государственных организаций. Представленные возможности будут представлять интерес прежде всего для здравоохранения, образования, ЖКХ, МФЦ и социальной сферы.
Как отметили в «Биорг», именно в этих областях резко возрос объем типизированных рутинных процессов (например, обработка входящих заявок или обращений, голосовых помощников, рецептов, анализов, больничных листов, школьных заданий и др.). Учитывая большое количество запросов, связанных с решением этих задач, «Биорг» идет навстречу пользователям и поддерживает всех, кто вынужден работать удаленно - компания перепрофилирует свою комбинированную платформу Beorg Smart Vision под существующие потребности. При этом краудсорсинговый сервис, c учетом сложившейся ситуации c распространением эпидемии в стране, будет предоставляться по себестоимости.
Согласно заявлению разработчика, Beorg Smart Vision – это инновационная бизнес-платформа, которая позволяет обрабатывать различные объекты и данные с особой точностью благодаря методу двойной обработки (нейронные сети плюс верификация операторами). В ядро системы заложены проприетарные алгоритмы и нестандартные ансамбли специализированных нейросетей, архитектура Faster-RCNN глубокого обучения. Это позволяет автоматически строить сложнейшие модели, учитывающие самые тонкие нюансы входящей информации с минимальным участием операторов (нет «узкого горлышка»). Особенности платформы: высокая скорость (от 2 секунд на документ) и низкая себестоимость обработки цифровых материалов, быстрая масштабируемость при качестве распознавания выше 99%.
По мнению «Биорг», в ситуации пандемии для новых категорий пользователей Beorg Smart Vision на первый план выходят ресурсы операторского пула компании (более 55 000 человек), ориентированного на профильные задачи и узкоспециализированные темы c отлаженной системой официального трудоустройства, рейтингами и обучением. Работа будет строиться в рамках SLA заказчика с использованием специального ПО, обязательной проверкой данных по справочникам и логическим условиям, а результаты интегрироваться с ИТ-системой организации.
«События последних месяцев показали, что мир вообще и наш бизнес-мир, в частности, переживают серьезные перемены. Больше удаленной работы, больше специализации и как можно меньше накладных расходов – таким нам видится лозунг ближайших лет. Как нельзя актуальным в этой связи становится труд операторов нашей краудсорсинговой платформы. Это люди разных специальностей, которые умеют хорошо работать с изображениями, делают оцифровку, разметку данных, модерацию и множество других типизированных операций. Они готовы приступить к любым проектам в кратчайшие сроки в режиме 24x7», отметил Георгий Зуев, основатель «Биорг» |
2019
Ключевое про платформу обработки данных
- На платформу загружаются задания и в режиме онлайн обрабатываются нейросетями и исполнителями.
- Первоначально используются операторы для обучения нейросети и разметки датасета, далее обработка проходит автоматически. Только проблемные задания попадают на визуальный контроль.
- Нейросеть справляется с рукописным текстом. Естественная чистота данных растет с каждым новым массивом. Повторная обработка и обратная сверка данных с документом позволяют доводить качество до максимального.
- Прозрачность для заказчика: контроль работ в режиме реального времени, онлайн взаимодействие с исполнителем.
- Есть возможность организации работ внутри организации (корпоративное облако)
Обработка более 30 млн документов
По информации компании «Биорг», с помощью её ключевой разработки – платформы Beorg Smart Vision – и краудсорсингового сервиса, насчитывающего более 55 000 операторов, за 2019 год обработано более 30 млн документов.
Подрядчики-лидеры по количеству проектов
ЭЛАР (Электронный архив, НПО Опыт) (241)
Directum (Директум) (132)
Smart Engines (Смарт Энджинс) (123)
Cognitive Technologies (Когнитивные технологии) (91)
Синтеллект (Syntellect) (78)
Другие (745)
Синтеллект (Syntellect) (52)
Smart Engines (Смарт Энджинс) (14)
ЭЛАР (Электронный архив, НПО Опыт) (10)
Directum (Директум) (5)
Abbyy Россия (4)
Другие (32)
ЭЛАР (Электронный архив, НПО Опыт) (10)
Beorg (Биорг) (8)
Smart Engines (Смарт Энджинс) (7)
NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
Digital Design (Диджитал Дизайн) (2)
Другие (19)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
ЭЛАР (Электронный архив, НПО Опыт) (11, 242)
Directum (Директум) (6, 161)
Smart Engines (Смарт Энджинс) (16, 130)
Abbyy Россия (16, 111)
Cognitive Technologies (Когнитивные технологии) (5, 96)
Другие (171, 621)
Синтеллект (Syntellect) (2, 52)
Smart Engines (Смарт Энджинс) (2, 14)
ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
Abbyy Россия (2, 7)
Directum (Директум) (3, 6)
Другие (16, 19)
Smart Engines (Смарт Энджинс) (3, 11)
ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
Beorg (Биорг) (1, 8)
Directum (Директум) (3, 4)
Digital Design (Диджитал Дизайн) (3, 2)
Другие (10, 11)
Smart Engines (Смарт Энджинс) (2, 22)
ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
Синтеллект (Syntellect) (2, 5)
Digital Design (Диджитал Дизайн) (2, 4)
Beorg (Биорг) (1, 4)
Другие (8, 10)
Smart Engines (Смарт Энджинс) (3, 16)
ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
Digital Design (Диджитал Дизайн) (2, 2)
Beorg (Биорг) (1, 2)
Content AI (Контент ИИ) (1, 2)
Другие (4, 4)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
ЭЛАР ПланСкан - 151 (151, 0)
Synerdocs - 130 (130, 0)
Smart ID Engine (ранее Smart IDReader) - 116 (113, 3)
ABBYY FlexiCapture - 93 (90, 3)
Е1 Евфрат - 87 (87, 0)
Другие 748
Syntellect Tessa Мобильное согласование - 30 (30, 0)
Syntellect Tessa Графический визуализатор процессов - 28 (28, 0)
Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
ABBYY FlexiCapture - 6 (6, 0)
ЭЛАР ПланСкан - 6 (6, 0)
Другие 27
Smart ID Engine (ранее Smart IDReader) - 11 (10, 1)
ЭЛАР ПланСкан - 9 (9, 0)
Beorg Smart Vision - 8 (8, 0)
ЭЛАР ПауэрСкан - 2 (2, 0)
EasyData: EasySeparate - 2 (2, 0)
Другие 12
Smart ID Engine (ранее Smart IDReader) - 18 (18, 0)
ЭЛАР ПланСкан - 8 (8, 0)
Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4 (4, 0)
Syntellect Tessa Графический визуализатор процессов - 4 (4, 0)
Beorg Smart Vision - 4 (4, 0)
Другие 18
Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
ЭЛАР ПланСкан - 5 (5, 0)
Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4 (4, 0)
ЭЛАР СканИмидж - 2 (2, 0)
ContentReader Server - 2 (2, 0)
Другие 7