OCR с использованием google-cloud-vision - результат не содержит uni-символов для польского, немецкого и т. Д.

Я пытаюсь использовать функцию распознавания текста в Google Vision API, но не могу получить ожидаемый результат. Я ожидаю увидеть ü для немецкого и ć, ń, ó, ś, ź, ł, ę, ą для польского в результатах. Как я могу это сделать?

Полученный текст не содержит унифицированных символов для многих языков: польского, немецкого. Но этот язык в списке поддерживаемых языков определился правильно.

введите здесь описание изображения

Я использую опцию перетаскивания здесь https://cloud.google.com/vision/ и пример CloudVision для Android . Спасибо за любые советы.


person Yuliia Ashomok    schedule 19.11.2016    source источник
comment
Привет, вы можете попробовать установить languageHints. cloud.google.com/vision/docs/languages ​​   -  person Jack Fan    schedule 21.11.2016


Ответы (1)


Я решил эту проблему. Для добавления символов UNI в результат вам необходимо установить LanguageHints.

Для Java это будет:

ImageContext imageContext = new ImageContext();
List<String> languages = new ArrayList<>();
languages.add("pl");
imageContext.setLanguageHints(languages);
annotateImageRequest.setImageContext(imageContext);

Теперь у меня есть ć, ń, ó, ś, ź, ł, ę, ą для польского языка в результатах.

person Yuliia Ashomok    schedule 23.11.2016