Производительность Tesseract ocr низкая

Я использую обертку tess4j для tesseract 3, чтобы сделать распознавание символов кириллицы. Перед тем, как я выполню предварительную обработку изображения: перекос изображения, удаление фона и шума, настройка качества изображения и, наконец, получение ROI для OCR. Предварительная обработка изображения занимает 0,5-1 секунду. Но процесс OCR tesseract занимает много времени.

Как повысить скорость распознавания текста tesseract?


person Vladimir    schedule 29.03.2016    source источник
comment
Это очень широко.   -  person C_B    schedule 29.03.2016


Ответы (1)


Есть два способа ускорить tessercat. Это относится к версии tesseract С++.

  1. Tesseract может обеспечить распараллеливание вычислений. См. переменную «tessedit_parallelize».

  2. Вы можете использовать версию tesseract для OpenCL.

person Andrey Macritskiy    schedule 29.03.2016