Использование Стэнфордского классификатора для распознавания символов

Я работаю над приложением для Android, связанным с OCR, и мне нужно использовать многомерную логистическую регрессию для классификации алфавитов. Мой вопрос в том, могу ли я использовать классификатор Стэнфорда (http://nlp.stanford.edu/software/classifier.shtml) для распознавания символов? Может ли он обучаться на наборе данных изображений? И если я не могу, пожалуйста, предложите мне библиотеку JAVA для этой цели.


person Abdul Wasae    schedule 12.10.2015    source источник


Ответы (1)


Великие умы думают одинаково. Я думал о том же самом. Специально для ОКР. Несмотря на то, что прошел почти год после того, как вы задали свой вопрос.

Это звучит достаточно просто; все, что вам нужно сделать, это нормализовать каждый символ в массив 5x7 (или, может быть, 64x128), а затем классифицировать на 26 символов верхнего и 26 символов нижнего регистра; плюс 10 цифр и 31 знак препинания на клавиатуре... Кажется выполнимым. Может быть, когда я получу кругленькую сумму...

Оказывается, есть библиотека Java для OCR https://sourceforge.net/projects/javaocr/ и это называется Java OCR (сюрприз! :-)). Единственная проблема в том, что: 1. Не работает из коробки. Это нужно тренировать. 2. Документация не очень хорошая. 3. У людей были проблемы с тем, чтобы заставить его работать.

Удачи.

person Tihamer    schedule 17.09.2016
comment
Уже сделал это, используя tesseract, а также API Google Mobile Vision :) спасибо :) - person Abdul Wasae; 17.09.2016