Неожиданный результат Tesseract при использовании флага «цифры»

Мое изображение target image и когда я

tesseract myimage.png result digits

Я получаю результат как 80 1 3047490, хотя я ожидаю получить только цифру, то есть 4749 на моем изображении. Что я делаю неправильно? Моя версия Tesseract 3.03.

PS: я тоже пробовал, безуспешно tesseract myimage.png result nobatch digits


person Bhushan    schedule 28.08.2015    source источник


Ответы (1)


Это ожидаемый результат: на выходе должны быть все цифры. В этом случае я бы использовал Regex для извлечения цифр из смешанного вывода или подстроки, если вы знаете положение чисел в строке.

person nguyenq    schedule 28.08.2015
comment
Спасибо @nguyenq за вклад, но я не могу использовать регулярное выражение, поскольку Tesseract иногда читает букву «S» как «9» (и наоборот). Я хотел, чтобы Tesseract выполнял сопоставление символов только с цифрами, если это возможно. - person Bhushan; 31.08.2015
comment
Вы можете попробовать шаблон bazaar: \A\A\A\A\A\d\d\d\d\A - person nguyenq; 01.09.2015
comment
Привет @nguyenq, я пытался использовать шаблон базара, но не смог, так как документации с примерами почти нет. Можете ли вы указать мне, какие команды вы используете для базарного шаблона? - person Bhushan; 28.10.2015