Вопросы по теме 'python-tesseract'

Tesseract OCR: параметр размера шрифта (один символ)
Я хочу использовать Tesseract для распознавания одного бесшумного символа с помощью типичного шрифта (например, Times New Roman, Arial и т. Д. Никакого странного шрифта). Входное изображение просто содержит символ, поэтому размер входного изображения...
4600 просмотров

Не могу получить правильные настройки тессеракта
Я пытаюсь использовать тессеракт на этом изображении: Когда я использую конфигурацию по умолчанию: tesseract image.jpg stdout Возвращает \KD FWOW . Как видите, единственная ошибка - первая буква L распознается как обратная косая...
124 просмотров

Как уменьшить использование памяти палочкой?
Я использую палочку и pytesseract, чтобы получить текст PDF-файлов, загруженных на сайт django, например: image_pdf = Image(blob=read_pdf_file, resolution=300) image_png = image_pdf.convert('png') req_image = [] final_text = [] for img in...
1918 просмотров

TesseractNotFoundError: C: \ Program Files \ Tesseract-OCR esseract.exe не установлен или находится не на вашем пути
Я запускаю Python через консольную среду Anaconda / Spyder. Версия - 3.7.2 (по умолчанию, 2 января 2019 г., 17:07:39) [MSC v.1915, 64-разрядная версия (AMD64)] Я выполнил рекомендации из этого сообщения stackoverflow: Ошибка Tesseract Not Found...
454 просмотров
schedule 23.09.2021

Tesseract: проблемы с символом верхнего регистра
Я использую Tesseract с Python. У меня есть изображение с 1-6 словами, и мне нужно прочитать текст. Иногда символ «C», который выглядит одинаково в верхнем и нижнем регистре, определяется как нижний регистр c, а не верхний регистр C. Я вижу...
652 просмотров
schedule 23.09.2021

pyTesseract не выводит текст из изображения
может кто-нибудь мог бы мне помочь! Когда я запускаю следующий код импортировать pytesseract из pytesseract импортировать image_to_string из PIL импортировать изображение импортировать PIL file =...
98 просмотров

Предварительная обработка изображения перед распознаванием текста с помощью Tesseract
У меня есть отсканированная страница, на которой я пытаюсь определить и проанализировать числа на изображении (строка за строкой). Для этого я использую Python Pytessarect со следующим кодом: img = cv2.imread('image.jpg',0) ret,thresh1 =...
74 просмотров

Определите передний и задний цвета с помощью OpenCV
Я новичок в Python и OpenCV. У меня есть несколько снимков экрана (прилагается один образец для справки), для которых я хочу определить передний и задний цвет текста. Я буду использовать эти цвета для расчета цветовой контрастности текста....
53 просмотров
schedule 15.09.2021

Как извлечь только определенный текст из файла PDF с помощью Python
Как извлечь часть определенного текста только из файлов PDF с помощью Python и сохранить выходные данные в определенных столбцах Excel. Вот образец входного PDF-файла (File.pdf) Ссылка на полный PDF-файл File.pdf Нам нужно извлечь...
1289 просмотров

Вывод Tesseract ocr с одиночными символами между обнаруженным текстом
Я пытаюсь использовать Tesseract для извлечения из изображения ниже, text = pytesseract.image_to_string(image, config='-c preserve_interword_spaces=1 --psm 1 --oem 1') Вот результат tesseract 4 ocr, print(text) Wrote Datastream...
141 просмотров

Обнаруживать только горизонтальный текст с Tesseract
У меня есть изображение с горизонтальным и вертикальным текстом. И я обнаруживаю текст с помощью tesseract OCR. А вот массив, который возвращает тессеракт 'text': ['', '', '', '', 'Some', 'other', 'text', 'horizontal', '', '', '', 'JEDIY9A',...
773 просмотров
schedule 29.09.2021

Как улучшить возможности автоматического поворота текста Tesseract для распознавания текста?
У меня есть набор изображений PIL, где некоторые страницы повернуты правильно, а другие имеют поворот, близкий к 180 °. Это означает, что автоматическое определение ориентации может не сработать, поскольку вместо 178 ° градусов распознается...
2493 просмотров

распознавание изображений с использованием pytesseract python
у меня есть изображение, но я не могу узнать цену, это то, что у меня есть import pytesseract pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract' print(pytesseract.image_to_string("local-filename.jpg"))...
133 просмотров

построить систему отслеживания и отслеживания с использованием Python и камеры для извлечения текста из ярлыка
Моя проблема в том, что камера настолько медленная и не плавная, что создает проблему для извлечения текста из этикетки в реальном времени. Я хочу знать, как сделать предварительный просмотр камеры более плавным, как с видеокамеры, существует большая...
60 просмотров

Как получить текст изображения с помощью Tesseract
Я получил это обрезанное изображение из своего pdf-файла: После предварительной обработки я передаю его в Tesseract OCR. text = pytesseract.image_to_string(img, lang='eng') Но ocr'ed text пуст. Редактировать: Я загружаю полное...
393 просмотров
schedule 01.03.2022

Команда tesseract не работает из командной строки в Windows
Я установил tesseract-OCR для Windows, и он находится по пути C: \ Program Files \ Tesseract-OCR в моей системе. Я установил переменную среды, добавив C: \ Program Files \ Tesseract-OCR в переменную PATH. Я также установил TESSDATA_PREFIX в...
2793 просмотров
schedule 06.03.2022

мы выполняем Pan OCR, используя tesseract, но не можем определить такие детали, как имя и номер панорамы
Мы обрезаем изображение панорамирования, увеличивая высоту на 20 пикселей для каждой итерации, а затем мы передаем это изображение в tesseract для выполнения ocr, но мы получаем шум с выводом. Если у вас есть лучшее решение для обработки изображений...
2284 просмотров

Можно ли проверить ориентацию изображения перед его передачей через модуль pytesseract ocr
Для моего текущего проекта ocr я попытался использовать tesserect, используя pytesseract оболочки python для преобразования изображений в текстовые файлы. До сих пор я передавал в свой модуль только хорошо ориентированные изображения, так как он мог...
11556 просмотров

Функция PyTesseract image_to_data не распознает мое изображение
Я использую pytesseract, чтобы вернуть координаты объектов на изображении. Используя этот фрагмент кода: import pytesseract from pytesseract import Output import cv2 img = cv2.imread('wine.jpg') d = pytesseract.image_to_data(img,...
2104 просмотров

UnicodeDecodeError с Tesseract OCR в Python
Я пытаюсь извлечь текст из файла изображения с помощью Tesseract OCR в Python, но я столкнулся с ошибкой, и я могу понять, как с ней справиться. вся моя среда хороша, так как я тестировал образец изображения с помощью ocr в python! вот код...
10141 просмотров
schedule 19.04.2022