Библиотека распознавания текста C/C++/Objective-C [закрыта]

Кто-нибудь знает какие-либо бесплатные библиотеки распознавания текста с открытым исходным кодом в C/C++/Objective-C? В основном что-то, что может сканировать изображение и читать весь простой текст.


person Andy White    schedule 08.11.2009    source источник
comment
Не уверен, что вы уже видели эту статью, но судя по вашему вопросу, она может вас заинтересовать: sudokugrab.blogspot.com/2009/07/how-does-it-all-work.html   -  person refulgentis    schedule 08.11.2009
comment
Спасибо за ссылку, вы должны дать ответ, и я дам вам голос   -  person Andy White    schedule 09.11.2009


Ответы (3)


Самый известный из них — Tesseract OCR, первоначально разработанный Motorola, а затем ставший открытым исходным кодом. Его также продвигает Google.

Есть еще несколько, возможно, не такие известные, как Tesseract: http://en.wikipedia.org/wiki/OCRopus http://jocr.sourceforge.net/

person rxin    schedule 08.11.2009
comment
После прыжка в качестве источника упоминается HP... - person stefanB; 09.11.2009
comment
Tesseract очень хорош, однако остерегайтесь его ограничений, когда дело доходит до работы с нелатинскими символами (например, китайскими). - person Jonathan; 09.11.2009
comment
Я попробовал tesseract с несколькими образцами, и он распознает несколько букв из целых абзацев, а остальное - ненужные символы, даже когда я печатаю целые английские слова в блокноте и делаю снимок экрана. - person James Wierzba; 18.12.2016

Библиотека OCR с открытым исходным кодом: 1. ABBYY Mobile OCR Engine – это мощный комплект для разработки программного обеспечения, который позволяет разработчикам мобильных и небольших приложений интегрировать технологии высокоточного оптического распознавания символов (OCR), которые преобразуют изображения и фотографии в управляемый и доступный для поиска текст. Инструментарий поддерживает самые популярные мобильные платформы и устройства — iOS (iPhone) и Android. http://www.abbyy.com/mobileocr/

2. Tesseract, вероятно, является наиболее точным доступным механизмом OCR с открытым исходным кодом. https://code.google.com/p/tesseract-ocr/

person Sumit Chauhan    schedule 18.06.2014
comment
Почему за это проголосовали? - person Mathai; 23.02.2015
comment
Я не против, но это очень похоже на рекламу ABBY Mobile без первоначального отказа от ответственности, что Sumit был связан с ними. Я не думаю, что это та ситуация, но я мог видеть, как в результате триггерный счастливый читатель проголосовал против. - person RyanfaeScotland; 21.08.2015

Вот интересная статья о том, как извлечь числа из картинки.

Автор собирает большое количество образцов для обучения своего алгоритма нейронных сетей, и я полагаю, что выполняет обработку изображений с помощью OpenCV.

person stefanB    schedule 09.11.2009