Я экспериментирую с функцией обнаружения текста API Google Vision и пытаюсь выполнить распознавание текста на текстовых изображениях. Текстовые изображения довольно чистые и работают в 80% случаев. 20% ошибок включают неправильно истолкованные цифры/символы (исправимые) и некоторые слова/цифры, которые просто не отображаются (неисправимые!).
Я следовал советам по страницам с рекомендациями (изображение 1024x768, 16-битный PNG) безрезультатно.
Вот пример: эта тестовая страница https://storage.googleapis.com/ximian-cloud.appspot.com/sample_page.png
Имеет номер 177 (В наблюдениях, справа от "РТ АРМ") и вообще не определяется API...
Я попытался:
- Удвоенное разрешение (2048 x 1536)
- BMP 24-бит
- BMP 32-бит
- Все вышеперечисленное в оттенках серого
- Все вышеперечисленное в перевернутом виде (черный фон и белые буквы)
Не повезло ...
Любой намек на то, почему это происходит? Это API или мой формат изображения может использовать какое-то форматирование?