Команда tesseract не работает из командной строки в Windows

Я установил tesseract-OCR для Windows, и он находится по пути C: \ Program Files \ Tesseract-OCR в моей системе.

Я установил переменную среды, добавив C: \ Program Files \ Tesseract-OCR в переменную PATH.

Я также установил TESSDATA_PREFIX в системной переменной в то же место выше тессеракта.

Тем не менее, когда я пытаюсь запустить команду «tesseract some path \ image.tif somepath \ output», появляется сообщение, что «tesseract не распознается как внутренняя или внешняя команда».

когда я запускаю ту же команду из места, где установлен tesseract, она работает нормально, но мне нужно, чтобы она была установлена ​​в переменных среды, так как она также позволит оболочке PYOCR распознавать ее.

PYOCR в настоящее время предоставляет "pyocr.get_available_tools () [0]" как пустой список.

Любая помощь горячо приветствуется.


person Abhilash    schedule 19.08.2017    source источник


Ответы (2)


Возможно, мой ответ немного запоздал, но я приведу свою настройку, которая, кажется, работает через несколько минут. Как и вы, я использовал библиотеку PYOCR, и вначале я получаю пустой список при использовании pyocr.get_available_tools().

Я запускаю его на ноутбуке с Windows 10.

Сначала я установил Tesseract в версии 4 в альфа-версии отсюда: https://github.com/UB-Mannheim/tesseract/wiki, а затем добавил местоположение в мою пользовательскую переменную Windows PATH. Отсюда запустите новую командную строку и убедитесь, что обнаружен инструмент tesseract, в противном случае среда настроена неправильно!

Затем я установил PyOCR с помощью простого pip pyocr и использовал следующий импорт перед использованием функций pyocr:

import pyocr
import pyocr.builders

РЕДАКТИРОВАТЬ: Я просмотрел текущие исходные файлы PYOCR и нашел следующее:

def is_available():
    _set_environment()
    return util.is_on_path(TESSERACT_CMD)

PyOCR просто ищет tesseract.exe в переменной пути вашей ОС, поэтому я думаю, вам просто нужно решить проблему с упоминанием, и она сработает.

РЕДАКТИРОВАТЬ 2: Я обновил ссылку для скачивания версией UB Mannheim. Кажется более эффективным с моими данными. Кроме того, я перешел на Tesseract 3, потому что многие флаги не поддерживались в альфа-сборке 4.0.

Надеюсь, это может немного помочь, С уважением

person Romain Cendre    schedule 09.10.2018
comment
В своем ответе вы предполагаете, что после установки tesseract можно будет запускать tesseract из командной строки, но в исходном вопросе человек уже не может этого сделать по какой-то причине, хотя он установил переменную PATH и сделал в основном все, что вы сделали. - person Dmitrii Z.; 09.10.2018
comment
Привет, Дмитрий! Как сказал Абхилаш Кумар, ему кажется, что Тессеракт не распознается его инструментом командной строки = ›Тем не менее, когда я пытаюсь запустить [...] внешнюю команду. Я просто пытаюсь дать базовые шаги, которые помогут PyOCR распознавать Tesseract в моей настройке. Иногда вы пробуете много чего и упускаете простые вещи. Не уверен, что это решит его проблему. РЕДАКТИРОВАТЬ: Посмотрите на мое редактирование, я думаю, что Path env var решит его проблему - person Romain Cendre; 10.10.2018

Пожалуйста, проверьте правильный путь установки Tesseract-OCR. Установка правильного пути, т.е. C:\Program Files (x86)\Tesseract-OCR у меня сработала.

person RGShankar    schedule 06.03.2018