Название базовой системы (платформы): | Искусственный интеллект (ИИ, Artificial intelligence, AI) |
Разработчики: | Московский технический университет связи и информатики (МТУСИ) |
Дата премьеры системы: | 2024/11/19 |
Технологии: | Системы видеоаналитики |
Основные статьи:
- Видеоаналитика (термины, сферы применения, технологии)
- Компьютерное зрение (машинное зрение)
- Нейросети (нейронные сети)
- Штрихкод
2024: Представление методики по нейросетевому распознаванию поврежденных штрих-кодов
В МТУСИ предложили методику по нейросетевому распознаванию поврежденных штриховых кодов. Об этом университет сообщил 19 ноября 2024 года.
Штрихкоды стали неотъемлемой частью нашей жизни, они встречаются повсюду — от товаров в магазинах до медикаментов в больницах. Однако часто штрихкоды повреждаются по различным причинам, таким как ежедневный износ, брызги жидкости или загрязнения, что затрудняет их распознавание. Это может привести к ошибкам в учёте товаров, медикаментов и других важных объектов.
На ноябрь 2024 года одними из самых популярных технологий, применяемых для идентификации товаров, являются различные виды маркировок и штрих-кодов — как одномерных, так и двумерных, а также технология прямой маркировки деталей (DPM) и RFID-метки.
Традиционные методы восстановления сильно повреждённых штрихкодов имеют свои ограничения. С появления QR-кодов важным направлением исследований стало их надежное сканирование и декодирование в различных средах. Существующие исследования в этой области в основном сосредоточены на повышении надежности QR-кодов через различные методы: коррекцию ошибок чтения, шумоподавление и улучшение изображений. Даже такая популярная технология глубокого обучения как GANscan — метод высокоскоростного изображения на основе генеративных противоборствующих сетей, который применяется для захвата QR-кодов на быстро движущихся сканирующих устройствах — не решает проблему восстановления поврежденных QR-кодов.
В связи с этим многие отечественные и зарубежные исследователи активно изучают возможность применения нейронных сетей для решения этой проблемы.
Исследование ведётся на кафедре «Интеллектуальные системы в управлении и автоматизации», на которой реализуются проекты по применению технологий машинного зрения в разных сферах жизни. Изучением особенностей использования нейронных сетей для распознавания поврежденных штриховых кодов занимаются магистр Максим Четыркин и старший преподаватель Данил Безумнов.
В рамках исследования проведен анализ технологий компьютерного зрения, которые используются для распознавания испорченных штрихкодов, такие как Dynamsoft Barcode Reader и Socket Mobile C860, рассмотрены процессы разработки и тестирования подобных систем. Исследователи сформулировали функциональные требования к разрабатываемой системе и определили этапы, необходимые для их реализации.
Технологии распознавания поврежденных маркировок применяются для их идентификации, отслеживания и верификации. Принцип работы системы по распознаванию поврежденных маркировок выглядит следующим образом: пользователь сканирует изображение с маркировкой при помощи специальной камеры, после чего нейронная сеть отмечает на видеопотоке расположение маркировки. Если программа не может распознать поврежденную маркировку, то нейросеть, основанная на алгоритмах нейронного восстановления изображения, восстановит информацию с маркировки, — рассказал Данил Безумнов. |
В ходе исследования отмечено, что на распознавание штрих-кода могут негативно влиять низкое разрешение изображения (недостаточная плотность пикселей), неправильное расположение, перекрытие штрих-кода другими предметами, качество материала, цвет и отражающая способность упаковки, на которую нанесен штрих-код.
Точность распознавания штрих-кодов во многом зависит от качества изображения. Для достижения приемлемой точности рекомендуется минимальное разрешение изображения не менее 200 точек на дюйм (DPI). Высокое разрешение обеспечивает большее количество точек на дюйм и, следовательно, более четкое изображение. Это особенно важно для обеспечения необходимой плотности пикселей, особенно в случае мелких полос и промежутков в штрих-коде. Одномерные штрих-коды обычно требуют не менее трех пикселей на самую маленькую полосу или промежуток, в то время как для двухмерных требуется около пяти пикселей, — отметил Максим Четыркин. |
Для создания программного обеспечения, способного распознавать поврежденные штриховые коды с помощью нейросетей, исследователи предлагают следующую последовательность действий:
1. Сбор данных: Необходимо собрать обширный набор данных, включающий как поврежденные, так и чёткие штриховые коды. Важно провести их аугментацию и очистку для обеспечения эффективного обучения модели.
2. Разработка архитектуры: Модель должна включать генеративно-состязательные сети (GAN) и архитектуру U-Net, специально адаптированные для восстановления поврежденных штриховых кодов. На этом этапе важно определить оптимальные гиперпараметры, которые обеспечат наилучшее обучение модели.
3. Обучение: Модель обучается на подготовленных данных с использованием выбранных гиперпараметров. Предварительно, важно оценить её производительность на валидационных данных и, при необходимости, внести коррективы для повышения эффективности.
4. Тестирование: Модель проверяется на отложенном тестовом наборе данных для оценки её способности восстанавливать поврежденные штриховые коды. Анализируются метрики качества восстановления, что позволяет оценить обобщающую способность модели.
Исследователи продолжают работать над улучшением всех этапов разработки системы, уделяя особое внимание адаптации моделей к различным условиям и сценариям использования.
Внедрение нейронных сетей для восстановления поврежденных штриховых кодов остается актуальным и перспективным направлением исследований в области машинного зрения, обеспечивая стабильность и надежность систем идентификации продукции в различных сферах промышленности и торговли.
Материал подготовлен на основе статьи «Нейросетевое распознавание поврежденных штриховых кодов».
Подрядчики-лидеры по количеству проектов
VizorLabs (Визорлабс) (41)
Вокорд (Vocord) (39)
ВидеоМатрикс (Videomatrix) (32)
VisionLabs (ВижнЛабс) (26)
Simetra (ранее А+С Транспроект) (18)
Другие (362)
ВидеоМатрикс (Videomatrix) (9)
Simetra (ранее А+С Транспроект) (6)
VisionLabs (ВижнЛабс) (5)
VizorLabs (Визорлабс) (5)
SteadyControl (4)
Другие (55)
VizorLabs (Визорлабс) (11)
ВидеоМатрикс (Videomatrix) (8)
Nord Clan (Норд Клан) (4)
Джей Эс Эй Групп (JSA Group) (3)
SteadyControl (2)
Другие (33)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Вокорд (Vocord) (9, 45)
VizorLabs (Визорлабс) (9, 40)
VisionLabs (ВижнЛабс) (13, 33)
ВидеоМатрикс (Videomatrix) (17, 32)
PTV Group (2, 25)
Другие (352, 233)
ВидеоМатрикс (Videomatrix) (9, 9)
VisionLabs (ВижнЛабс) (3, 9)
PTV Group (1, 6)
Ростелеком (3, 5)
VizorLabs (Визорлабс) (2, 5)
Другие (17, 30)
VizorLabs (Визорлабс) (7, 11)
ВидеоМатрикс (Videomatrix) (7, 8)
SteadyControl (1, 3)
SteadyControl HoReCa (1, 3)
VisionLabs (ВижнЛабс) (2, 2)
Другие (18, 19)
VizorLabs (Визорлабс) (4, 13)
SteadyControl (1, 7)
SteadyControl HoReCa (1, 7)
Технологии безопасности дорожного движения (ТБДД) (1, 3)
VisionLabs (ВижнЛабс) (1, 2)
Другие (15, 18)
SteadyControl HoReCa (1, 5)
SteadyControl (1, 5)
Nord Clan (Норд Клан) (1, 3)
Softline (Софтлайн) (1, 1)
VizorLabs (Визорлабс) (1, 1)
Другие (8, 8)
Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)
Vizorlabs Платформенное решение видеоаналитики - 36 (11, 25)
VisionLabs Luna - 34 (24, 10)
PTV Visum - 25 (25, 0)
SteadyControl Система контроля и управления персоналом - 23 (23, 0)
Vocord FaceControl - 18 (13, 5)
Другие 199
VisionLabs Luna - 11 (5, 6)
PTV Visum - 6 (6, 0)
Vizorlabs Платформенное решение видеоаналитики - 4 (0, 4)
SteadyControl Система контроля и управления персоналом - 4 (4, 0)
Ростелеком: Умный дом Видеонаблюдение - 3 (3, 0)
Другие 21
Vizorlabs Платформенное решение видеоаналитики - 7 (1, 6)
SteadyControl Система контроля и управления персоналом - 3 (3, 0)
VisionLabs Luna - 2 (1, 1)
Vmx SILA: HSE - 2 (2, 0)
Nord Clan: RDetector - 2 (2, 0)
Другие 19
Vizorlabs Платформенное решение видеоаналитики - 11 (2, 9)
SteadyControl Система контроля и управления персоналом - 7 (7, 0)
ТБДД: Азимут Комплексы фотовидеофиксации - 3 (3, 0)
Nord Clan: ML Sense - 2 (2, 0)
Русатом Интеллектуальная транспортная система - 2 (2, 0)
Другие 7
SteadyControl Система контроля и управления персоналом - 5 (5, 0)
Nord Clan: ML Sense - 3 (3, 0)
Vizorlabs Платформенное решение видеоаналитики - 1 (0, 1)
VisionLabs Luna - 1 (0, 1)
PTV Visum - 1 (1, 0)
Другие 2