SL Soft: SOICA OCR-платформа

Продукт
Разработчики: SOICA (Сойка), SL Soft (СЛ Софт)
Дата последнего релиза: 2024/03/27
Технологии: BI,  СЭД - Системы потокового распознавания

Содержание

Основные статьи:

SOICA - платформа для автоматической обработки и аналитики документов. Платформа позволяет формировать единое окно для поступления бумажных и электронных документов, осуществлять их классификацию, сортировку, комплектацию, распознавание, анализ и сверку как между собой, так и с внешними источниками. Также SOICA позволяет модифицировать изображения, наносить отметки делопроизводителей, выполнять анонимизацию данных, фиксировать наличие печатей, штампов, подписей и рукописного текста. SOICA поставляет настроечную среду с технологией No code, что позволяет настраивать проекты любой сложности по обработке неструктурированных документов специалистам, не владеющим языками программирования (данные на апрель 2022г.).

2024

Получение статуса ИИ-продукта

Компания SL Soft (ГК Softline) 29 июля 2024 года сообщила о получении отметки об отнесении платформы SOICA к сфере искусственного интеллекта. Соответствующий признак внесен в Реестр российского программного обеспечения. Это означает, что при внедрении платформы SOICA заказчики могут рассчитывать на снижение выплат по налогу на прибыль согласно Письму ФНС России от 07.03.2023 № СД-4-3/2672@.

SOICA — OCR-платформа для потокового распознавания, извлечения и обработки данных из скан-образов и цифровых копий структурированных и неструктурированных документов любого типа. SOICA помогает компаниям автоматизировать рутинные задачи, упростить бизнес-процессы и повысить эффективность работы.

Использование ИИ в SOICA обеспечивает более высокую скорость и точность работы, что позволяет значительно сократить время на обработку информации. SOICA эффективно справляется с распознаванием данных из сложных и нестандартных документов, даже если скан-образ содержит большое количество шумов и дефектов.

«
Мы стремимся к постоянному совершенствованию наших решений и использованию передовых технологий, чтобы создавать максимально эффективные инструменты для наших клиентов, — отметил Виктор Горюнов, директор SOICA, компания SL Soft (ГК Softline).
»

Расширение функциональности платформы

Компания SL Soft (ГК Softline) расширила функциональность OCR-платформы SOICA — добавлена возможность распознавания рукописного текста. Это упрощает обработку ряда документов: паспортов, военных билетов и других документов, удостоверяющих личность, а также заявлений, бланков, протоколов, справок, анкет и прочих материалов, полностью или частично содержащих текст, написанный от руки. Об этом разработик сообщил 27 марта 2024 года.

Точность распознавания находится в диапазоне 80-95% и напрямую зависит от разборчивости почерка и качества скан- или фотокопии. Для работы со сложными документами из специфической предметной области, исторических архивов или материалами на других языках (по умолчанию в системе предусмотрено распознавание на русском и английском), возможно дообучение системы под конкретного заказчика на предоставленных данных.

SOICA — универсальная платформа для распознавания, извлечения и обработки данных из скан-образов и цифровых копий структурированных и неструктурированных документов.

«
SOICA позиционируется как единое комплексное корпоративное решение для потоковой обработки любых документов. Внедрение функции распознавания рукописного текста расширяет возможности его применения и привносит дополнительную ценность в продукт. Теперь наши заказчики могут полностью автоматически обрабатывать любые документы, содержащие рукописный текст, а их все еще больше, чем можем показаться: паспорта, дипломы, трудовые книжки, анкеты, заявления, приказы, письма и т.д. Качественное распознавание рукописного текста важно для многих заказчиков, особенно в сферах страхования, ритейла и банковской отрасли. Машинная обработка значительно ускоряет ввод данных и минимизирует число ошибок, — пояснил Александр Павлов, управляющий директор SOICA, компания SL Soft (ГК Softline).
»

Как OCR помогает автоматизировать документооборот

Практически все крупные и средние компании перешли на работу с электронными документами — это касается как документооборота с контрагентами, так и оцифровки бумажных версий. В обоих случаях совместно с СЭД (и иными системами хранения и обработки документации) применяются OCR-решения. Они позволяют извлечь информацию из скан-образов и цифровых копий структурированных и неструктурированных документов любого типа, автоматизируя таким образом работу различных подразделений. Рассмотрим подробнее типичные сценарии использования современных OCR-решений, которые реализовывает команда SOICA компании SL Soft. Подробнее здесь.

Интеграция с «1С:Документооборотом»

SOICA от SL Soft (ГК Softline) интегрирована с «1С:Документооборот». Об этом Softline сообщил 21 февраля 2024 года.

Совместное использование этих решений позволяет быстрее выполнять рутинные трудоемкие операции по обработке электронной и оцифрованной документации.

На февраль 2024 года существует два режима работы коннектора. В автоматическом документы сразу попадают в SOICA (поступают по REST API, электронной почте или берутся из локальной и сетевой папок), в ручном пользователи загружают в нее документы из интерфейса «:Документооборот». Далее SOICA обрабатывает файлы: устраняет шумы, перекосы, настраивает яркость и контрастность и т.п. для получения оптимального качества изображения. Следующий шаг — SOICA классифицирует документы (при необходимости разделяет единый полученный файл на отдельные документы) и извлекает информацию, которая передается в «1С:Документооборот» для автоматического заполнения регистрационных карточек.

«
Разработка коннектора расширяет потенциал использования платформы SOICA, поскольку предоставляет большему числу пользователей возможность работать с ней. Использование SOICA и «1С:Документооборот» ускорит и облегчит выполнение рутинной работы для многих специалистов, чья деятельность связана с документацией, – отметил Виктор Горюнов, управляющий директор SOICA, компания SL Soft.
»

2022: В составе решения для расширения возможности СЭД по загрузке и обработке массивов бумажных документов

Компания Docsvision 25 мая 2022 года сообщила, что совместно с Soica представили совместное решение, позволяющее расширить возможности СЭД по загрузке и обработке массивов бумажных документов. Совместное решение – это стек российских технологий: платформы Docsvision и системы потокового распознавания и автоматической обработки документов Soica, которые в совокупности повысят независимость российских компаний от зарубежного программного обеспечения. Подробнее здесь.



ПРОЕКТЫ (2) ИНТЕГРАТОРЫ (2) СМ. ТАКЖЕ (4)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Прогноз (250)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  RBC Group Украина (124)
  БизнесАвтоматика НПЦ (119)
  Консультационная группа АТК (100)
  Другие (2519)

  Сапиенс солюшнс (Sapiens solutions) (9)
  Форсайт (8)
  Navicon (Навикон) (7)
  Корус Консалтинг (6)
  Доверенная среда (5)
  Другие (101)

  БизнесАвтоматика НПЦ (12)
  Форсайт (8)
  ФТО (5)
  Manzana Group (М Софт) (4)
  Optimacros (Оптимакрос) (3)
  Другие (74)

  Manzana Group (М Софт) (5)
  БизнесАвтоматика НПЦ (5)
  Инфомаксимум (Infomaximum) (5)
  Analytic Workspace (ОСТ) (4)
  Arenadata (Аренадата Софтвер) (4)
  Другие (66)

  Simetra (ранее А+С Транспроект) (9)
  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (5)
  Arenadata (Аренадата Софтвер) (4)
  Инфомаксимум (Infomaximum) (3)
  Другие (47)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Qlik (QlikTech) (59, 464)
  Форсайт (19, 332)
  SAP SE (70, 303)
  Oracle (65, 267)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (4, 236)
  Другие (1113, 1633)

  SAP SE (6, 13)
  Qlik (QlikTech) (2, 8)
  Форсайт (2, 8)
  Microsoft (2, 6)
  Доверенная среда (1, 5)
  Другие (50, 78)

  БизнесАвтоматика НПЦ (1, 12)
  Форсайт (3, 8)
  Optimacros (Оптимакрос) (1, 6)
  Microsoft (1, 5)
  Manzana Group (М Софт) (3, 4)
  Другие (40, 50)

  Optimacros (Оптимакрос) (1, 10)
  Форсайт (2, 8)
  Manzana Group (М Софт) (2, 5)
  Analytic Workspace (ОСТ) (2, 5)
  PIX Robotics (Пикс Роботикс) (1, 5)
  Другие (37, 59)

  Simetra (ранее А+С Транспроект) (1, 9)
  БизнесАвтоматика НПЦ (1, 7)
  SL Soft (СЛ Софт) (5, 6)
  Полиматика (Polymatica) (5, 6)
  VMware (2, 6)
  Другие (29, 51)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  QlikView - 411 (370, 41)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 333 (318, 15)
  Deductor - 226 (226, 0)
  IBM Cognos - 162 (58, 104)
  Visary BI Платформа бизнес-аналитики - 119 (119, 0)
  Другие 1283

  SAP NetWeaver Business Warehouse (SAP BW/4HANA) - 8 (8, 0)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 8 (7, 1)
  QlikView.Next - 6 (0, 6)
  Microsoft Power BI - 5 (5, 0)
  Доверенная среда: Триафлай BI-платформа - 5 (5, 0)
  Другие 64

  Visary BI Платформа бизнес-аналитики - 12 (12, 0)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 8 (5, 3)
  Optimacros Платформа для оптимизационного и консолидационного планирования - 6 (6, 0)
  Microsoft Power BI - 5 (5, 0)
  QlikView.Next - 4 (0, 4)
  Другие 35

  Optimacros Платформа для оптимизационного и консолидационного планирования - 10 (10, 0)
  Форсайт. Аналитическая платформа (ранее Prognoz Platform) - 8 (7, 1)
  Инфомаксимум: Proceset (Система класса Process mining) - 5 (5, 0)
  PIX BI - 5 (5, 0)
  Analytic Workspace BI-платформа - 5 (3, 2)
  Другие 38

  TransInfo - 9 (0, 9)
  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  VMware Tanzu Greenplum - 6 (1, 5)
  Optimacros Платформа для оптимизационного и консолидационного планирования - 6 (6, 0)
  Polymatica Analytics Аналитическая платформа - 5 (2, 3)
  Другие 19

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (242)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (123)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (746)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (16)
  ЭЛАР (Электронный архив, НПО Опыт) (9)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Content AI (Контент ИИ) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (17, 130)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (171, 622)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (10, 11)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 16)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
  Digital Design (Диджитал Дизайн) (2, 2)
  Beorg (Биорг) (1, 2)
  Content AI (Контент ИИ) (1, 2)
  Другие (5, 5)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151 (151, 0)
  Synerdocs - 130 (130, 0)
  Smart ID Engine (ранее Smart IDReader) - 116 (113, 3)
  ABBYY FlexiCapture - 93 (90, 3)
  Е1 Евфрат - 87 (87, 0)
  Другие 750

  Syntellect Tessa Мобильное согласование - 30 (30, 0)
  Syntellect Tessa Графический визуализатор процессов - 28 (28, 0)
  Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
  ABBYY FlexiCapture - 6 (6, 0)
  ЭЛАР ПланСкан - 6 (6, 0)
  Другие 27

  Smart ID Engine (ранее Smart IDReader) - 11 (10, 1)
  ЭЛАР ПланСкан - 9 (9, 0)
  Beorg Smart Vision - 8 (8, 0)
  Directum Jazz - 2 (2, 0)
  ЭЛАР ПауэрСкан - 2 (2, 0)
  Другие 12

  Smart ID Engine (ранее Smart IDReader) - 18 (18, 0)
  ЭЛАР ПланСкан - 8 (8, 0)
  ЭЛАР СканИмидж - 4 (4, 0)
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4 (4, 0)
  Syntellect Tessa Графический визуализатор процессов - 4 (4, 0)
  Другие 18

  Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
  ЭЛАР ПланСкан - 5 (5, 0)
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4 (4, 0)
  ContentReader Server - 2 (2, 0)
  ЭЛАР СканИмидж - 2 (2, 0)
  Другие 9