ContentCapture (ранее Content AI FlexiCapture)

Продукт
Разработчики: Content AI (Контент ИИ)
Дата последнего релиза: 2023/11/27
Технологии: СЭД - Системы потокового распознавания

Содержание

ContentCapture (ранее FlexiCapture) – универсальная платформа для интеллектуальной обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы. C ContentCapture можно ускорить и упростить любые процессы, связанные с документооборотом.

ContentCapture оснащена инструментами, позволяющими гибко интегрировать процесс потокового ввода в текущую деятельность компании, что значительно упрощает обмен данными внутри организации.

Решения могут быть интегрированы с различными информационными системами, например, ECM, CRM, RPA, АБС и т.д.

2024: Совместимость ContentCapture 14 с Astra Linux Special Edition 1.7

Content AI и «Группа Астра» 25 апреля 2024 года объявили о совместимости своих продуктов: ContentCapture 14 и защищенной ОС Astra Linux Special Edition 1.7.

По результатам комплексного тестирования компании подписали сертификат, подтверждающий корректность совместной работы Astra Linux Special Edition и ContentCapture 14, кросс-платформенной версии решения для интеллектуальной обработки документов.

«
Сертификация ПО от Content AI станет значимой новостью для рынка, так как российские организации применяют автоматизированную обработку документов и данных не один десяток лет, и теперь вендор официально гарантирует корректность работы ContentCapture под Astra Linux. Это дает нашим клиентам уверенность, что можно успешно пользоваться технологиями, не зависящими от зарубежных разработчиков, и сохранить непрерывность бизнес-процессов. Мы очень рады тому, что коллеги из Content AI разделяют нашу позицию относительно необходимости обеспечивать полную совместимость продуктов, и уверены, что в результате дальнейшего сотрудничества конечным пользователям всегда будут доступны самые современные версии нашего софта, корректно работающие в рамках одной ИТ-инфраструктуры, — сказал Алексей Трубочев, директор департамента сопровождения «Группы Астра».
»

2023

Доступность на Linux в сетевом варианте использования

Компания Content AI 27 ноября 2023 года выпустила обновленную кросс-платформенную версию своего флагманского продукта ContentCapture 14.

В данном релизе платформа для извлечения данных и потоковой обработки информации из любых типов документов стала доступна на Linux в сетевом варианте использования, который позволяет задействовать мощности нескольких серверов для обработки большого количества документов. Сетевая установка предназначена для крупных проектов, где требуется обрабатывать десятки и сотни тысяч страниц ежедневно. Благодаря переходу на кросс-платформенный технологический стек продукт предоставляет одинаковую функциональность, вне зависимости от используемой ОС.

Также поддержан вариант гибридной инсталляции, когда в процессе импортозамещения на первом этапе на Linux мигрирует только серверная часть, а рабочие станции остаются на Windows. Это позволит осуществить миграцию максимально комфортно для пользователей.

«
В 2023 году фокус внимания команды Content AI сосредоточен на адаптации ключевых продуктов, в том числе ContentCapture для Linux, – уточнил технический директор компании Иван Волков. – В процессе реализации задачи мы ориентировались на лучшие практики по созданию кросс-платформенного ПО. Важно, чтобы наши решения сохраняли привычные пользователям свойства Windows-версий, и при этом были совместимы с отечественными операционными системами, такими как Astra Linux, ОС Альт и РЕД ОС. Серверная часть решения упакована в docker-контейнеры и готова к работе как на отдельных Linux-машинах, так и в составе docker-кластера.
»

Решение СontentCapture предназначено для компаний, которые в ежедневном режиме обрабатывают большие потоки входящей электронной и бумажной документации. Платформа позволяет автоматизировать обработку информации, извлеченной из отсканированных бумаг, фотографий, электронных документов. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы.

ContentCapture входит в реестр отечественного ПО и может заместить продукты западных вендоров – ABBYY FlexiCapture, Kofax Capture, IBM Datacap.

«
В основе продуктов Content AI лежат одни из лучших в мире технологий для интеллектуального распознавания данных и обработки естественного языка. Сегодня нам важно адаптировать их для нужд российских заказчиков, поэтому компания занимается выпуском решений для Linux и их совместимостью с отечественными операционными системами. Мы работаем в тесной связке с представителями различных секторов бизнеса и вместе находим оптимальные решения задач замещения иностранного софта, – пояснила Светлана Дергачева, генеральный директор Content AI.
»

В 2024 году Content AI также планирует выпустить ряд важных функциональных обновлений ContentCapture, связанных с повышением удобства использования продукта и упрощением основных операций.

Обновление с функцией распознавания русского рукописного текста

Функция распознавания русского рукописного текста появилась в обновленной версии платформы для интеллектуальной обработки информации ContentCapture. Обновленный релиз своего флагманского продукта 17 июля 2023 года представил российский разработчик ИИ-решений Content AI.

ContentCapture

Как сообщалось, программа с обновленной функциональностью способна с оптимальной точностью распознавать в документах заполненные от руки поля на русском языке. Ранее ContentCapture могла распознавать только рукопечатный текст, где каждая буква прописывалась в отдельных полях заполняемой формы, например, анкеты или опроса. В данном релизе эти возможности объединены: система автоматически определяет, как написан текст, и распознает символы.

Важное технологическое изменение – способность распознавать курсив, то есть фразы, написанные без отрыва ручки от бумаги. Это одна из самых сложных задач, с которой ранее OCR-редакторы справлялись менее успешно. Кроме того, в выпуске существенно оптимизировано качество распознавания рукописного английского текста.

В ходе тестирования обновленной функциональности ContentCapture подтверждена точность распознавания данных в документах определенного типа в диапазоне 85-95%: речь идёт о паспортах и других документах, удостоверяющих личность, тестовых формах, служебных записках, подготовленных в свободном стиле.

«
Качество распознавания в рамках данной задачи сильно зависит от разборчивости почерка и вида документа. Во внутренних тестах мы ориентировались на лучшие образцы технологий, имеющиеся на российском рынке. По ряду сценариев распознавание русского рукописного текста в ContentCapture демонстрирует оптимальные показатели среди всех протестированных продуктов. Мы готовы индивидуально обучать и настраивать систему для более точной обработки конкретного, даже самого редкого, типа документа, если у заказчиков будет такая необходимость.

уточнил Иван Волков, технический директор Content AI
»

«
Сценарии применения технологии распознавания рукописного текста востребованы в различных сферах, в которых ведется работа с документами, заполненными от руки, например в финансовых организациях и государственных структурах. Через специалистов этих ведомств ежедневно проходят десятки и сотни документов с элементами рукописного текста – паспортов, свидетельств, анкет, заявлений. Ввод данных в информационные системы зачастую осуществляется вручную. Автоматическая обработка и распознавание не только значительно оптимизирует скорость работы сотрудников, но и сократит количество ошибок, которые могут быть допущены при ручном переносе данных.

отметила Светлана Дергачева, генеральный директор Content AI
»

В основе технологии распознавания русского рукописного текста лежат собственные разработки Content AI в области нейронных сетей. Современные методики впервые применены для реализации этой функциональности. В текущем релизе распознавание русского рукописного текста доступно в версии ContentCapture для Windows. До конца 2023 года планируется выпуск кросс-платформенной версии с возможностью использования на операционных системах на базе Linux.

В числе других обновлений релиза ContentCapture – редизайн интерфейса веб-станций. Он стал более легким и современным. При этом внутренняя структура продукта не претерпела значительных изменений, поэтому уже знакомые с платформой пользователи смогут приступить к работе без необходимости повторного обучения.

Включение в реестр российского ПО

Универсальная платформа для интеллектуальной обработки информации ContentCapture включена в реестр российского ПО под номером 17598. Об этом компания Content AI (Контент ИИ) сообщила 17 мая 2023 года.

ContentCapture — это российский аналог продукта ABBYY FlexiCapture, модифицированный специально для отечественного рынка с учетом потребностей российских пользователей. В основе платформы лежат технологии распознавания и интеллектуальной обработки документов. Решение позволяет ускорить и упростить любые процессы, связанные с документооборотом за счет высококачественного распознавания, классифицикации, извлечения данных из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений.

«
Бизнес нуждается в инструментах, позволяющих быстро и качественно обрабатывать информацию. Платформа ContentCapture способна стать ключевым элементом корпоративной инфраструктуры в организациях, которые управляют множеством бизнес-процессов и ежедневно принимают и генерируют большой поток данных, — отметила генеральный директор Content AI Светлана Дергачева. — Также ContentCapture идеально вписывается в стратегию цифровой трансформации. Собирая и анализируя информацию, платформа способствует ускорению транзакций, снижению затрат, повышению эффективности и оперативному принятию решений.
»

Включение ContentCapture в реестр отечественного ПО дает возможность различным ведомствам, компаниям из государственного сектора, образовательным учреждениям и архивам беспрепятственно использовать продукт в работе. С его помощью организации смогут в разы увеличить скорость и качество обработки информации, что в конечном итоге позволит быстрее реагировать на обращения граждан.

Content AI планирует развивать платформу ContentCapture, исходя из актуальных потребностей российского бизнеса. В следующих версиях предполагается расширение функциональности продукта для реализации новых пользовательских задач, которые постоянно возникают в процессе цифровой трансформации бизнеса и государственных структур. В числе приоритетных направлений – адаптация решения для упрощенной бесшовной интеграции с отечественным программным обеспечением на базе Linux.

Смена названия на ContentCapture

В январе-феврале 2023 года универсальная платформа для интеллектуальной обработки информации из любых типов документов FlexiCapture была переименована в ContentCapture.





Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (239)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (118)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (741)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (12)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (22)
  ЭЛАР (Электронный архив, НПО Опыт) (14)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (10)
  Digital Design (Диджитал Дизайн) (2)
  ЭЛАР (Электронный архив, НПО Опыт) (2)
  Beorg (Биорг) (1)
  Ростелеком (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 240)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (15, 125)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (169, 615)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (9, 10)

  Smart Engines (Смарт Энджинс) (2, 23)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 14)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (2, 10)
  Digital Design (Диджитал Дизайн) (2, 2)
  ЭЛАР (Электронный архив, НПО Опыт) (2, 2)
  Beorg (Биорг) (1, 1)
  Docsvision (ДоксВижн) (1, 1)
  Другие (1, 1)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151 (151, 0)
  Synerdocs - 130 (130, 0)
  Smart ID Engine (ранее Smart IDReader) - 114 (111, 3)
  ABBYY FlexiCapture - 93 (90, 3)
  Е1 Евфрат - 87 (87, 0)
  Другие 740

  Syntellect Tessa Мобильное согласование - 30 (30, 0)
  Syntellect Tessa Графический визуализатор процессов - 28 (28, 0)
  Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
  ЭЛАР ПланСкан - 8 (8, 0)
  ABBYY FlexiCapture - 6 (6, 0)
  Другие 27

  Smart ID Engine (ранее Smart IDReader) - 11 (10, 1)
  ЭЛАР ПланСкан - 9 (9, 0)
  Beorg Smart Vision - 8 (8, 0)
  Directum Jazz - 2 (2, 0)
  ЭЛАР ПауэрСкан - 2 (2, 0)
  Другие 12

  Smart ID Engine (ранее Smart IDReader) - 19 (19, 0)
  ЭЛАР ПланСкан - 9 (9, 0)
  Syntellect Tessa Графический визуализатор процессов - 4 (4, 0)
  Beorg Smart Vision - 4 (4, 0)
  ЭЛАР СканИмидж - 4 (4, 0)
  Другие 18

  Smart ID Engine (ранее Smart IDReader) - 9 (9, 0)
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 2 (2, 0)
  ЭЛАРобот - 1 (1, 0)
  ИСКО Ареопад Информационная система коллегиальных органов - 1 (1, 0)
  Syntellect Tessa Графический визуализатор процессов - 1 (1, 0)
  Другие 2