Кто-нибудь знает какие-либо бесплатные библиотеки распознавания текста с открытым исходным кодом в C/C++/Objective-C? В основном что-то, что может сканировать изображение и читать весь простой текст.
Библиотека распознавания текста C/C++/Objective-C [закрыта]
Ответы (3)
Самый известный из них — Tesseract OCR, первоначально разработанный Motorola, а затем ставший открытым исходным кодом. Его также продвигает Google.
Есть еще несколько, возможно, не такие известные, как Tesseract: http://en.wikipedia.org/wiki/OCRopus http://jocr.sourceforge.net/
Библиотека OCR с открытым исходным кодом: 1. ABBYY Mobile OCR Engine – это мощный комплект для разработки программного обеспечения, который позволяет разработчикам мобильных и небольших приложений интегрировать технологии высокоточного оптического распознавания символов (OCR), которые преобразуют изображения и фотографии в управляемый и доступный для поиска текст. Инструментарий поддерживает самые популярные мобильные платформы и устройства — iOS (iPhone) и Android. http://www.abbyy.com/mobileocr/
2. Tesseract, вероятно, является наиболее точным доступным механизмом OCR с открытым исходным кодом. https://code.google.com/p/tesseract-ocr/
Вот интересная статья о том, как извлечь числа из картинки.
Автор собирает большое количество образцов для обучения своего алгоритма нейронных сетей, и я полагаю, что выполняет обработку изображений с помощью OpenCV.