IBM Watson Visual Recognition

Продукт
Название базовой системы (платформы): IBM Watson
Разработчики: IBM
Отрасли: Интернет-сервисы
Технологии: Системы видеоаналитики

Основные статьи:

2022: Провал тестирования распознавания образов

Искусственный интеллект распознает изображения хуже человека.

У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета. Об этом ВШЭ сообщила 7 сентября 2022 года.

Чтобы понять, как машинное восприятие изображений отличается от человеческого, российские ученые загрузили изображения классических визуальных иллюзий в онлайн-сервис распознавания образов IBM Watson Visual Recognition. Большая часть из них представляла собой геометрические силуэты, частично скрытые геометрическими формами цвета заднего плана. Система пыталась определить, что представляет собой поступившее изображение, и указывала степень уверенности в своем ответе.

Оказалось, что искусственный интеллект не способен распознать ни одну воображаемую фигуру. Исключение составил раскрашенный воображаемый треугольник. В силу высокого контраста с фоном он был распознан правильно.

«
Объекты, похожие на те, что мы использовали в ходе эксперимента, встречаются в реальной жизни, — сказал автор исследования Владимир Винников, аналитик Научно-учебной лаборатории методов анализа больших данных факультета компьютерных наук ВШЭ. — Например, прицеп трейлера или радиобашня, которые по ночам обозначаются только габаритными огнями, автопилот автомобиля или самолета воспринимает таким же образом, как мы — воображаемые геометрические фигуры.
»

Человеческий глаз постоянно непроизвольно движется, а светочувствительная поверхность его сетчатки имеет форму полусферы. Чтобы человек увидел иллюзию, изображению достаточно быть векторным — состоять из опорных точек и соединяющих их кривых. Человеческое воображение достроит картинку благодаря физиологической особенности зрения — постоянному движению глаз.

В оптико-электронных системах все устроено иначе. Их светочувствительная матрица имеет плоскую, как правило прямоугольную, форму, а сама система линз далеко не так свободна в движении, как человеческий глаз. Поэтому искусственный интеллект не может достроить воображаемые линии, которые связывают фрагменты геометрической иллюзии. Машинное зрение видит только то, что реально изображено, тогда как человек достраивает в воображении полное изображение по его очертаниям.

Нейросетевые системы распознавания образов активно распространяются в коммерческом секторе. Однако вопрос, насколько точно машина распознает изображение, до сих остается открытым. От точности его распознавания могут зависеть человеческие жизни. Например, если автопилот автомобиля или самолета не распознает объект с низкой контрастностью относительно фона и не успеет вовремя уклониться от препятствия, может произойти катастрофа.

Ученые полагают, что недостатки машинного распознавания образов можно исправить.

Например, дополнить распознавание растровых изображений, представляющих собой сетку пикселей, имитацией физиологических особенностей движения глаз, которые позволяют глазу видеть двумерные и трехмерные сцены. Альтернативный способ — добавить векторное описание изображений. Оно позволит запрограммировать машину на обход изображения по траекториям, заданным векторами.

«
Воображаемые фигуры обязательно стоит использовать в качестве тестов в системах, которые зависят от распознавания фото- и видеопотоков. Например, в автопилотах машин или беспилотных летательных аппаратов. Это поможет избежать рисков, связанных с использованием систем машинного интеллекта в промышленности и транспортных системах, — полагает Владимир Винников.
»



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  VizorLabs (Визорлабс) (41)
  Вокорд (Vocord) (39)
  ВидеоМатрикс (Videomatrix) (32)
  VisionLabs (ВижнЛабс) (25)
  Simetra (ранее А+С Транспроект) (18)
  Другие (320)

  ВидеоМатрикс (Videomatrix) (9)
  Simetra (ранее А+С Транспроект) (6)
  VisionLabs (ВижнЛабс) (5)
  VizorLabs (Визорлабс) (5)
  Талмер (Talmer) (4)
  Другие (49)

  VizorLabs (Визорлабс) (11)
  ВидеоМатрикс (Videomatrix) (8)
  Nord Clan (Норд Клан) (4)
  Джей Эс Эй Групп (JSA Group) (3)
  VisionLabs (ВижнЛабс) (2)
  Другие (30)

  VizorLabs (Визорлабс) (13)
  Ростелеком (3)
  VisionLabs (ВижнЛабс) (3)
  Транс-Телематика (3)
  Урбантех (3)
  Другие (33)

  VizorLabs (Визорлабс) (2)
  KAMAZ Digital (ЦП КАМАЗ) (1)
  Metrarobotics (Метрароботикс) (1)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (1)
  Simetra (ранее А+С Транспроект) (1)
  Другие (10)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Вокорд (Vocord) (9, 45)
  VizorLabs (Визорлабс) (9, 40)
  ВидеоМатрикс (Videomatrix) (17, 32)
  VisionLabs (ВижнЛабс) (13, 32)
  PTV Group (2, 25)
  Другие (332, 180)

  ВидеоМатрикс (Videomatrix) (9, 9)
  VisionLabs (ВижнЛабс) (3, 9)
  PTV Group (1, 6)
  Ростелеком (3, 5)
  VizorLabs (Визорлабс) (2, 5)
  Другие (14, 21)

  VizorLabs (Визорлабс) (7, 11)
  ВидеоМатрикс (Videomatrix) (7, 8)
  VisionLabs (ВижнЛабс) (2, 2)
  Nord Clan (Норд Клан) (1, 2)
  Clearview AI (1, 1)
  Другие (16, 16)

  VizorLabs (Визорлабс) (4, 13)
  Технологии безопасности дорожного движения (ТБДД) (1, 3)
  Nord Clan (Норд Клан) (1, 2)
  Softlogic (Софтлоджик Рус) (1, 2)
  VisionLabs (ВижнЛабс) (1, 2)
  Другие (13, 14)

  NVI Research (1, 1)
  Softline (Софтлайн) (1, 1)
  Российская ассоциация экспертов рынка ритейла (1, 1)
  Трэктис (1, 1)
  PTV Group (1, 1)
  Другие (3, 3)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Vizorlabs Платформенное решение видеоаналитики - 36 (11, 25)
  VisionLabs Luna - 33 (24, 9)
  PTV Visum - 25 (25, 0)
  Vocord Traffic - 18 (16, 2)
  Vocord FaceControl - 18 (13, 5)
  Другие 175

  VisionLabs Luna - 11 (5, 6)
  PTV Visum - 6 (6, 0)
  Vizorlabs Платформенное решение видеоаналитики - 4 (0, 4)
  SecurOS - 3 (2, 1)
  Hikvision HikCentral - 3 (3, 0)
  Другие 17

  Vizorlabs Платформенное решение видеоаналитики - 7 (1, 6)
  VisionLabs Luna - 2 (1, 1)
  Nord Clan: RDetector - 2 (2, 0)
  Vmx SILA: HSE - 2 (2, 0)
  Vmx MarkerID: WNR - 1 (1, 0)
  Другие 18

  Vizorlabs Платформенное решение видеоаналитики - 11 (2, 9)
  ТБДД: Азимут Комплексы фотовидеофиксации - 3 (3, 0)
  Nord Clan: ML Sense - 2 (2, 0)
  VisionLabs Luna - 2 (2, 0)
  Русатом Интеллектуальная транспортная система - 2 (2, 0)
  Другие 5

  Vizorlabs Платформенное решение видеоаналитики - 1 (0, 1)
  Softline Digital: RozniTech Платформа для сетевого ритейла (ранее Retailix.Ai) - 1 (1, 0)
  NVI Solutions: owl.Guard - 1 (1, 0)
  PTV Visum - 1 (1, 0)
  Tracktice Система подсчета пассажиропотока - 1 (1, 0)
  Другие -1