Распознавание штрих-кода с помощью OCR

Я пытаюсь распознать штрих-код, используя простой CNN, рассматривая его как проблему распознавания нескольких цифр. Результаты не очень хорошие. Поэтому я искал несколько лучших моделей глубокого обучения для того же. Во время поиска я не нашел ни одной модели распознавания штрих-кодов. Итак, мой вопрос: Можно ли научить модели OCR распознавать штрих-коды. Я нахожу задачу обнаружения и распознавания штрих-кода очень похожей на распознавание текста. Есть ли что-то, что мне не хватает?


person snowdenassange    schedule 09.05.2020    source источник
comment
Привет! Очень интересный подход. Ответ зависит от того, какую символику штрих-кода вы пытаетесь прочитать (одномерные штрих-коды, такие как EAN, или двумерные, такие как QR-код и PDF417)? И что именно вы подразумеваете под распознаванием - я полагаю, это чтение содержимого штрих-кода?   -  person Cerovec    schedule 10.05.2020
comment
Я пытаюсь читать одномерные штрих-коды... да, например, EAN-13. Да, мне нужно прочитать содержание. Хотя меня больше интересует, может ли OCR работать со штрих-кодами?   -  person snowdenassange    schedule 10.05.2020


Ответы (1)


Хотя CNN можно использовать для чтения содержимого штрих-кода, особенно в ситуации, когда для обучения доступны массивные наборы данных изображений, сложно сопоставить производительность классического алгоритма чтения штрих-кода со стандартными подходами ИИ.

Разница между чтением текста и чтением штрих-кода носит структурный характер. Текст принципиально неструктурирован, в то время как штрих-коды структурированы для удобства чтения с использованием специально разработанных алгоритмов декодирования.

Все эти алгоритмы чтения имеют правила, которые во многих случаях не так уж сложно реализовать. С другой стороны, CNN пришлось бы нелегко, и им потребуются огромные объемы данных, чтобы изучить эти правила.

Кроме того, многие символы штрих-кода (включая EAN) используют алгоритмы обнаружения или исправления ошибок (например, контрольные цифры), которые можно интегрировать в цикл исправления ошибок для дальнейшего повышения производительности сканирования.

Итак, в теории OCR и сканирование штрих-кода — похожие проблемы, а на практике есть существенные различия.

Примечание. Я работаю в компании Microblink, где мы занимаемся исследованиями и разработками в области сканирования штрих-кодов и распознавания текста. Когда дело доходит до сканирования штрих-кода, мы перепробовали практически все в репертуаре ИИ, чтобы получить от него максимальную отдачу, и в итоге использовали как CNN, так и классические алгоритмы, работающие вместе.

person Cerovec    schedule 10.05.2020