Есть ли OCR, который можно обучить новым символам?

Существует ли какой-либо бесплатный OCR с открытым исходным кодом, который можно обучить новым символам, а также выводить координаты символа, найденного на целевом изображении? Я читал, что tesseract OCR можно обучить, но может ли он дать мне координаты после OCR? любой пример? Мне нужен код/шаги для обучения распознаванию изображений с использованием изображения, содержащего один символ. На одном изображении есть около 20 символов для обучения. а затем используйте обученный OCR для обнаружения этих символов на целевом изображении и, если они будут найдены, также укажите координаты.


person Computer User    schedule 31.05.2011    source источник


Ответы (1)


Вы можете научить Tesseract распознавать новые символы. Формат hocr содержит координаты распознанных слов.

https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract

http://vietocr.sourceforge.net/training.html

https://github.com/tesseract-ocr/tesseract/wiki/Command-Line-Usage#hocr-output

person nguyenq    schedule 05.06.2011
comment
У вас есть более подробная информация об этом? Ссылки старые/мертвые. - person Tiago; 17.04.2017