Я запускаю Python через консольную среду Anaconda / Spyder. Версия - 3.7.2 (по умолчанию, 2 января 2019 г., 17:07:39) [MSC v.1915, 64-разрядная версия (AMD64)]
Я выполнил рекомендации из этого сообщения stackoverflow: Ошибка Tesseract Not Found
для работы со следующей ошибкой:
TesseractNotFoundError: C: \ Program Files \ Tesseract-OCR esseract.exe не установлен или находится не на вашем пути
Обратите внимание, что часть пути отсутствует. Он установлен по адресу: C: \ Program Files \ Tesseract-OCR \ tesseract.exe.
В моем файле pytesseract.py я изменил путь, как было предложено: tesseract_cmd = 'C: \ Program Files \ Tesseract-OCR \ tesseract.exe
Это не решило мою проблему и привело к появлению сообщения об ошибке с отсутствующей частью строки пути.
TesseractNotFoundError: C: \ Program Files \ Tesseract-OCR esseract.exe не установлен или находится не на вашем пути
Я поигрался с этим и добавил второй \, как показано ниже:
Код Python:
tesseract_cmd = 'C: \ Program Files \ Tesseract-OCR \\ tesseract.exe'
Теперь он отлично работает, читает и успешно конвертирует изображение всей страницы газеты в текст строки.
Ничто в рекомендациях, которым я изначально следовал, не указывало, что я должен добавить второй \ к пути, и я сам не понимаю, зачем мне это нужно.
Буду признателен за любые указания, почему это произошло?