TEXT_DETECTION игнорирование/удаление слов

Я экспериментирую с функцией обнаружения текста API Google Vision и пытаюсь выполнить распознавание текста на текстовых изображениях. Текстовые изображения довольно чистые и работают в 80% случаев. 20% ошибок включают неправильно истолкованные цифры/символы (исправимые) и некоторые слова/цифры, которые просто не отображаются (неисправимые!).

Я следовал советам по страницам с рекомендациями (изображение 1024x768, 16-битный PNG) безрезультатно.

Вот пример: эта тестовая страница https://storage.googleapis.com/ximian-cloud.appspot.com/sample_page.png

Имеет номер 177 (В наблюдениях, справа от "РТ АРМ") и вообще не определяется API...

Я попытался:

  • Удвоенное разрешение (2048 x 1536)
  • BMP 24-бит
  • BMP 32-бит
  • Все вышеперечисленное в оттенках серого
  • Все вышеперечисленное в перевернутом виде (черный фон и белые буквы)

Не повезло ...

Любой намек на то, почему это происходит? Это API или мой формат изображения может использовать какое-то форматирование?


person Neurus    schedule 02.11.2016    source источник
comment
Здесь та же проблема... Самое смешное, что попробуйте этот инструмент API (cloud.google.com/vision) правильно распознает мое изображение, но когда я сам запрашиваю API, он пропускает некоторые очевидные слова :((   -  person Stalinko    schedule 05.08.2017
comment
Я почти уверен, что это та же проблема, что и эта: stackoverflow.com/questions/50117524/. Пожалуйста подтвердите.   -  person WindRider    schedule 12.06.2018


Ответы (1)


Это ошибка, которая уже была замечена и зарегистрирована, сейчас в процессе исправления, надеюсь, довольно скоро.

person George    schedule 30.11.2016
comment
Дружественный пинг - я только что проверил это еще раз, и он все еще не работает (v1). Это исправлено в v1.1? Как я могу получить доступ к бета-версии? Спасибо - person Neurus; 16.03.2017