OCR с использованием google-cloud-vision - результат не содержит uni-символов для польского, немецкого и т. Д.

Я пытаюсь использовать функцию распознавания текста в Google Vision API, но не могу получить ожидаемый результат. Я ожидаю увидеть ü для немецкого и ć, ń, ó, ś, ź, ł, ę, ą для польского в результатах. Как я могу это сделать?

Полученный текст не содержит унифицированных символов для многих языков: польского, немецкого. Но этот язык в списке поддерживаемых языков определился правильно.

Я использую опцию перетаскивания здесь https://cloud.google.com/vision/ и пример CloudVision для Android . Спасибо за любые советы.

google-cloud-vision

Yuliia Ashomok 19.11.2016 источник

comment

Привет, вы можете попробовать установить languageHints. cloud.google.com/vision/docs/languages - Jack Fan 21.11.2016

Ответы (1)

arrow_upward
1
arrow_downward

Я решил эту проблему. Для добавления символов UNI в результат вам необходимо установить LanguageHints.

Для Java это будет:

ImageContext imageContext = new ImageContext();
List<String> languages = new ArrayList<>();
languages.add("pl");
imageContext.setLanguageHints(languages);
annotateImageRequest.setImageContext(imageContext);

Теперь у меня есть ć, ń, ó, ś, ź, ł, ę, ą для польского языка в результатах.

Yuliia Ashomok 23.11.2016

OCR с использованием google-cloud-vision - результат не содержит uni-символов для польского, немецкого и т. Д.

Ответы (1)

Вопросы по теме