Название базовой системы (платформы): | Amazon Web Services (AWS) |
Разработчики: | Amazon |
Дата премьеры системы: | май 2019 г |
Технологии: | SaaS - Программное обеспечение как услуга, СЭД - Системы потокового распознавания |
2019: Анонс
В конце мая 2019 года Amazon запустила облачный сервис для распознавания документов Textract, который способен автоматически извлекать из страниц текст, таблицы и другие данные. Поддерживаются различные форматы, включая JPEG, PNG и PDF.
Textract относится к программам оптического распознавания текста (OCR), как и, например, Abbyy FineReader. В отличие от многих OCR-решений Textract не просто извлекает текст из документов, но и распознаёт их формат и содержание. Например, он различает таблицы и формы в документах, в том числе в чеках, налоговых декларациях и товарных накладных, а также поддерживает графические форматы. После распознавания ПО самостоятельно структурирует данные.
В Amazon утверждают, что сервис Textract способен определить паспортные данные, даты рождения и адреса, после чего правильно интерпретировать вне зависимости от того, в каком месте страницы они находятся. В случае изменения шаблона система не пропустит неправильный результат.
По словам разработчиков, добиться высокой эффективности распознавания удалось за счёт использования машинного обучения (МО) для обработки миллионов документов. В результате система научилась правильно идентифицировать текст и объекты «практически в любом» типе документов.
Разработчикам для подключения Textract к своим приложениям не нужно быть специалистами по машинному обучению, говорит вице-президент отдела Amazon Machine Learning Свами Сивасубраманян (Swami Sivasubramanian). Они могут извлекать текст и данные, используя СУБД и аналитические сервисы Amazon и наладить интеграцию с другими МО-сервисами.
Textract предназначен для автоматического распознавания большого количества документов. Стоимость пользования сервисом начинается с $1,5 за 1000 обработанных страниц.[1]
Примечания
Подрядчики-лидеры по количеству проектов
ВидеоМост (VideoMost) (1767)
Elma (Элма, Интеллект Лаб, Практика БПМ) (1641)
TrueConf (Труконф) (1590)
Террасофт (Terrasoft, ТС-Консалтинг) (1147)
Naumen (Наумен консалтинг) (502)
Другие (8234)
Elma (Элма, Интеллект Лаб, Практика БПМ) (244)
Террасофт (Terrasoft, ТС-Консалтинг) (186)
ВидеоМост (VideoMost) (181)
Directum (Директум) (110)
QuickBPM (83)
Другие (752)
Elma (Элма, Интеллект Лаб, Практика БПМ) (230)
ВидеоМост (VideoMost) (101)
Directum (Директум) (81)
1С-Рарус (30)
Адванта Консалтинг (Advanta) (26)
Другие (544)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
1С Акционерное общество (35, 2777)
ВидеоМост (VideoMost) (3, 1818)
Elma (Элма, Интеллект Лаб, Практика БПМ) (4, 1761)
TrueConf (Труконф) (3, 1606)
Creatio (12, 1231)
Другие (1894, 6894)
Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 327)
Directum (Директум) (2, 233)
Creatio (1, 198)
ВидеоМост (VideoMost) (2, 183)
1С Акционерное общество (13, 144)
Другие (148, 497)
Directum (Директум) (2, 237)
Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 233)
ВидеоМост (VideoMost) (1, 102)
1С Акционерное общество (9, 97)
Projecto (Проджекто) (1, 26)
Другие (86, 319)
Elma (Элма, Интеллект Лаб, Практика БПМ) (2, 180)
Directum (Директум) (1, 147)
1С Акционерное общество (12, 82)
Naumen (Наумен консалтинг) (5, 22)
Адванта Консалтинг (Advanta) (1, 16)
Другие (74, 237)
1С Акционерное общество (6, 21)
Optimacros (Оптимакрос) (1, 5)
Webinar Group (Вебинар, Вебинар Технологии) (1, 5)
B2B-Center (Центр развития экономики) (1, 4)
ВидеоМост (VideoMost) (1, 4)
Другие (41, 60)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
ВидеоМост (VideoMost) ВКС - 1818 (1817, 1)
1С:Предприятие 8.3 - 1628 (204, 1424)
TrueConf Server - 1606 (1590, 16)
ELMA BPM Suite - 1431 (1431, 0)
Creatio (ранее bpm’online) - 1231 (937, 294)
Другие 4700
ELMA BPM Suite - 241 (241, 0)
Directum RX - 233 (233, 0)
Creatio (ранее bpm’online) - 198 (198, 0)
ВидеоМост (VideoMost) ВКС - 183 (182, 1)
1С:Предприятие 8.3 - 136 (4, 132)
Другие 388
Directum RX - 237 (237, 0)
ELMA BPM Suite - 151 (151, 0)
ВидеоМост (VideoMost) ВКС - 102 (102, 0)
1С:Предприятие 8.3 - 92 (4, 88)
ELMA365 - 83 (83, 0)
Другие 208
ELMA365 - 161 (161, 0)
Directum RX - 147 (147, 0)
1С:Предприятие 8.3 - 74 (3, 71)
ELMA BPM Suite - 22 (22, 0)
Advanta (Адванта) - система управления проектами - 16 (16, 0)
Другие 153
1С:Предприятие 8.3 - 19 (2, 17)
МТС Линк Платформа для бизнес-коммуникаций и совместной работы - 5 (5, 0)
Optimacros Платформа для оптимизационного и консолидационного планирования - 5 (5, 0)
B2B-Center: Мои поставщики - 4 (4, 0)
1С-Битрикс24 - 4 (4, 0)
Другие 36
Подрядчики-лидеры по количеству проектов
ЭЛАР (Электронный архив, НПО Опыт) (239)
Directum (Директум) (132)
Smart Engines (Смарт Энджинс) (120)
Cognitive Technologies (Когнитивные технологии) (91)
Синтеллект (Syntellect) (78)
Другие (741)
Синтеллект (Syntellect) (52)
Smart Engines (Смарт Энджинс) (14)
ЭЛАР (Электронный архив, НПО Опыт) (12)
Directum (Директум) (5)
Abbyy Россия (4)
Другие (32)
ЭЛАР (Электронный архив, НПО Опыт) (10)
Beorg (Биорг) (8)
Smart Engines (Смарт Энджинс) (7)
NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
Digital Design (Диджитал Дизайн) (2)
Другие (19)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
ЭЛАР (Электронный архив, НПО Опыт) (11, 240)
Directum (Директум) (6, 161)
Smart Engines (Смарт Энджинс) (15, 127)
Abbyy Россия (16, 111)
Cognitive Technologies (Когнитивные технологии) (5, 96)
Другие (169, 615)
Синтеллект (Syntellect) (2, 52)
Smart Engines (Смарт Энджинс) (2, 14)
ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
Abbyy Россия (2, 7)
Directum (Директум) (3, 6)
Другие (16, 19)
Smart Engines (Смарт Энджинс) (3, 11)
ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
Beorg (Биорг) (1, 8)
Directum (Директум) (3, 4)
Digital Design (Диджитал Дизайн) (3, 2)
Другие (9, 10)
Smart Engines (Смарт Энджинс) (2, 23)
ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
Синтеллект (Syntellect) (2, 5)
Digital Design (Диджитал Дизайн) (2, 4)
Beorg (Биорг) (1, 4)
Другие (8, 10)
Smart Engines (Смарт Энджинс) (2, 12)
ЭЛАР (Электронный архив, НПО Опыт) (2, 3)
Digital Design (Диджитал Дизайн) (2, 2)
Синтеллект (Syntellect) (1, 1)
Beorg (Биорг) (1, 1)
Другие (1, 1)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
ЭЛАР ПланСкан - 151 (151, 0)
Synerdocs - 130 (130, 0)
Smart ID Engine (ранее Smart IDReader) - 115 (112, 3)
ABBYY FlexiCapture - 93 (90, 3)
Е1 Евфрат - 87 (87, 0)
Другие 741
Syntellect Tessa Мобильное согласование - 30 (30, 0)
Syntellect Tessa Графический визуализатор процессов - 28 (28, 0)
Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
ЭЛАР ПланСкан - 8 (8, 0)
ABBYY FlexiCapture - 6 (6, 0)
Другие 27
Smart ID Engine (ранее Smart IDReader) - 11 (10, 1)
ЭЛАР ПланСкан - 9 (9, 0)
Beorg Smart Vision - 8 (8, 0)
Directum Jazz - 2 (2, 0)
ЭЛАР ПауэрСкан - 2 (2, 0)
Другие 13
Smart ID Engine (ранее Smart IDReader) - 19 (19, 0)
ЭЛАР ПланСкан - 8 (8, 0)
Beorg Smart Vision - 4 (4, 0)
ЭЛАР СканИмидж - 4 (4, 0)
Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4 (4, 0)
Другие 18
Smart ID Engine (ранее Smart IDReader) - 10 (10, 0)
Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 3 (3, 0)
ЭЛАР ПланСкан - 2 (2, 0)
Syntellect Tessa Графический визуализатор процессов - 1 (1, 0)
Digital Design: Приоритет Система документационного управления - 1 (1, 0)
Другие 2