Бинаризация и фоновая фильтрация в opencv

Вкратце, я хочу выполнить процедуры предварительной обработки перед OCR с предложением от ABBYY технологии. Статья состоит из двух частей:

  • Фильтрация фона: отделите текстовые строки от фона. введите описание изображения здесь
  • Адаптивная бинаризация: линии и слова будут правильно распознаваться, и будет достигнута более высокая точность распознавания. И они пытаются воздействовать на персонажей. введите описание изображения здесь введите описание изображения здесь

Интересно, есть ли способы достичь их с помощью opencv? Любые предложения или образцы кодов будут оценены.


person R4j    schedule 11.02.2014    source источник
comment
выглядит как своего рода адаптивное пороговое значение: попробуйте docs.opencv.org/modules / imgproc / doc /   -  person Micka    schedule 11.02.2014
comment
@Micka Я думаю, что адаптивного определения порога недостаточно для большинства случаев, я попробовал и получил плохие результаты, он создает область точек на изображениях и закрывает символы.   -  person R4j    schedule 14.02.2014


Ответы (2)


Я бы посоветовал вам использовать этот код: http://liris.cnrs.fr/christian.wolf/software/binarize/ В частности, бинаризация wolf, она очень хорошо работает на практике и требует очень небольших изменений в коде C ++, если вы хотите использовать его с opencv. По сути, вы должны передать этой функции указатель на данные вашего изображения.

person paghdv    schedule 12.02.2014

Вот пара статей, надеюсь, они будут полезны:

Бумага от XEROX: http://www.xrce.xerox.com/content/download/6708/51560/file/Binarising-camera-images-for-OCR.pdf

И еще одна хорошая статья о предварительной обработке изображений для ocr: http://wbieniec.kis.p.lodz.pl/research/files/07_memstech_ocr.pdf

person Andrey Smorodov    schedule 12.02.2014
comment
Спасибо, на самом деле я прочитал много книг и получил несколько советов, затем я пытаюсь применить множество методов обработки для своего приложения, но они не охватывают большинство случаев, потому что мое приложение использует автоматические процедуры предварительной обработки для всех изображений. - person R4j; 14.02.2014