Smart Engines: Метод искусственного зрительного интеллекта

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Smart Engines (Смарт Энджинс)
Дата премьеры системы: 2023/05/03
Технологии: СЭД - Системы потокового распознавания

Основные статьи:

2023: Регистрация в США патента на метод искусственного зрительного интеллекта

Ученые российской компании Smart Engines получили патент США на фирменную разработку. Изобретение позволяет оптимизировать работу нейросетевых архитектур, которые используются для распознавания изображений. Авторами изобретения являются старший научный сотрудник-программист Smart Engines Александр Шешкус, генеральный директор Smart Engines к.т.н. Владимир Арлазаров, технический директор Smart Engines к.ф.-м.н. Дмитрий Николаев, профессор, член-корреспондент РАН и директор по науке Smart Engines д.т.н. Владимир Львович Арлазаров. Патент № US 11636608 B2 датирован 25 апреля 2023 года. Об этом 3 мая 2023 года сообщила представители Smart Engines.

Smart Engines зарегистрировала в США патент на метод искусственного зрительного интеллекта

Как сообщалось, авторы изобретения предложили нейросетевую архитектуру, объединяющую блоки, используемые в современных нейросетях, с классическим инструментом анализа изображений реального мира – преобразованием Хафа. Изобретатели рассчитывают, что предложенная архитектура откроет страницу в истории успеха нейросетевых технологий в компьютерном зрении. Первые исследования Хафовских нейросетей, уже опубликованные в научной периодике, полностью подтверждают эту идею. Запатентованное решение уже используется в программных продуктах компании Smart Engines для автономного распознавания паспортов, ID-карт и других документов.

«
Нейросети извлекают информацию из примеров, но их практически невозможно научить непреложным законам физики или математики. Показательны недавние упражнения сети ChatGPT в арифметике. При умножении больших чисел сеть правильно указывает первые и последнии цифры результата, и даже угадывает его длину, а вот центральные цифры ставит "от балды". Довольно забавный результат, ведь для правильного решения требуется в миллиарды раз меньше ресурсов, чем те, что есть в распоряжении у нейросети. Встает вопрос: а можно ли вообще изучать математику на примерах? Иммануил Кант считал, что человек в своем познании опирается в том числе на априорные формы, не зависящие от опыта. Мы считаем, что нам удалось встроить в нейросеть дополнительное априорное геометрическое представление, лежащее в основе законов перспективы. Это позволяет ей строить решения задач компьютерного зрения, таких как определение ориентации объектов в пространстве или определение собственного положения.

рассказал Владимир Арлазаров, директор по науке Smart Engines д.т.н.
»

«
Самое частое использование преобразования Хафа – это поиск и выделение прямых. Они в области обработки и анализа изображений играют важную роль: это и дороги, и дома, и границы документа, и строки, и рентгеновские лучи, формирующие томограмму, и многое другое. Но эти отрезки почти всегда не совсем прямые, часто зашумлены или видны только частично, имеют разную длину. Поэтому проведение классического Хаф-анализа изображения представляет собой довольно сложную задачу. Между тем, как раз с теми проблемами, которые затрудняют Хаф-анализ изображения, справляются нейросети и, более того, существуют систематические методы решения подобных проблем.

отметил Александр Шешкус, старший научный сотрудник-программист Smart Engines
»

«
В 2023 году подавляющее большинство задач технического зрения решается с использованием нейросетей, в развитии которых много лет не ставился вопрос экономии. При этом именно для задач зрения характерны большие объемы входных данных даже в тривиальных приложениях. В результате проблема сокращения вычислительных затрат стоит крайне остро. Предложенная нами архитектура с использованием преобразования Хафа обеспечивает конкурентное качество при значительно меньшем количестве обучаемых параметров и при требовании меньшего количества вычислительных мощностей.

подчеркнул Дмитрий Николаев, технический директор Smart Engines к.ф.-м.н.
»

Это уже третий патент, зарегистрированный Smart Engines в США. В феврале 2023 года ученые Smart Engines запатентовали в Штатах систему эффективной локализации и идентификации документов на изображениях. В общей сложности Smart Engines зарегистрировала три патента в США, восемь – в России, а также создала 26 полезных моделей.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (242)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (123)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (746)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (16)
  ЭЛАР (Электронный архив, НПО Опыт) (9)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Content AI (Контент ИИ) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (17, 130)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (171, 622)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (10, 11)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 16)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
  Digital Design (Диджитал Дизайн) (2, 2)
  Beorg (Биорг) (1, 2)
  Content AI (Контент ИИ) (1, 2)
  Другие (5, 5)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151 (151, 0)
  Synerdocs - 130 (130, 0)
  Smart ID Engine (ранее Smart IDReader) - 116 (113, 3)
  ABBYY FlexiCapture - 93 (90, 3)
  Е1 Евфрат - 87 (87, 0)
  Другие 750

  Syntellect Tessa Мобильное согласование - 30 (30, 0)
  Syntellect Tessa Графический визуализатор процессов - 28 (28, 0)
  Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
  ABBYY FlexiCapture - 6 (6, 0)
  ЭЛАР ПланСкан - 6 (6, 0)
  Другие 27

  Smart ID Engine (ранее Smart IDReader) - 11 (10, 1)
  ЭЛАР ПланСкан - 9 (9, 0)
  Beorg Smart Vision - 8 (8, 0)
  Directum Jazz - 2 (2, 0)
  ЭЛАР ПауэрСкан - 2 (2, 0)
  Другие 12

  Smart ID Engine (ранее Smart IDReader) - 18 (18, 0)
  ЭЛАР ПланСкан - 8 (8, 0)
  ЭЛАР СканИмидж - 4 (4, 0)
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4 (4, 0)
  Syntellect Tessa Графический визуализатор процессов - 4 (4, 0)
  Другие 18

  Smart ID Engine (ранее Smart IDReader) - 12 (12, 0)
  ЭЛАР ПланСкан - 5 (5, 0)
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4 (4, 0)
  ContentReader Server - 2 (2, 0)
  ЭЛАР СканИмидж - 2 (2, 0)
  Другие 9