Tessj4 - Ошибка при открытии файла данных ./tessdata/eng.traineddata

У меня есть эта проблема в моем веб-приложении в Tomcat 9:

Ошибка при открытии файла данных ./tessdata/eng.traineddata Убедитесь, что для переменной среды TESSDATAPREFIX задан родительский каталог вашего каталога tessdata. Ошибка загрузки языка "eng". Tesseract не может загрузить ни одного языка!

Я создаю папку C: \ Tess4J из архива Tess4J 3.0.4 с подпапками:

  • dist
    • tess4j-3.0.jar
  • lib
    • LIBS
  • nbproject
  • src
  • tessdata
    • Downloaded ZIP with languages and extracted here
  • тестовое задание

В catalina.properties я добавляю:

  • C: /Tess4J/dist/tess4j-3.0.jar,C: / Tess4J / lib

В средах я пытаюсь добавить оба, но не работает:

  • TESSDATA_PREFIX -> C: / Tess4J
  • TESSDATA_PREFIX -> C: / Tess4J / tessdata

Затем я вызываю свой сервлет с методом doOCR и получаю ошибку.

Не могли бы вы мне помочь?


person kete nefrega    schedule 21.03.2016    source источник
comment
Вы уверены, что используете версию тессеракта 3.0 (она несовместима со старой версией)? Папка tessdata должна содержать такие данные, как eng.traineddata, eng.cube.bigrams, eng.cube.fold и т. Д. Вы можете скачать тему здесь: github.com/tesseract-ocr/tessdata   -  person Radim Burget    schedule 30.03.2016


Ответы (1)


Вы должны выбрать каталог вверх, в вашем случае C:\Tess4J, попробуйте:

tessInst= new Tesseract();
tessInst.setDatapath("C:\\Tess4J"); 
tessInst.setLanguage("eng");

Извините за мой английский

person Genarito    schedule 04.02.2017
comment
tessInst.setLanguage (англ.); эта строка помогла мне с другой ошибкой: сменить язык на hun: D спасибо. - person SüniÚr; 25.03.2019