Вопросы по теме 'python-tesseract'
Tesseract OCR: параметр размера шрифта (один символ)
Я хочу использовать Tesseract для распознавания одного бесшумного символа с помощью типичного шрифта (например, Times New Roman, Arial и т. Д. Никакого странного шрифта). Входное изображение просто содержит символ, поэтому размер входного изображения...
4600 просмотров
schedule
24.10.2021
Не могу получить правильные настройки тессеракта
Я пытаюсь использовать тессеракт на этом изображении:
Когда я использую конфигурацию по умолчанию:
tesseract image.jpg stdout
Возвращает \KD FWOW . Как видите, единственная ошибка - первая буква L распознается как обратная косая...
124 просмотров
schedule
10.09.2021
Как уменьшить использование памяти палочкой?
Я использую палочку и pytesseract, чтобы получить текст PDF-файлов, загруженных на сайт django, например:
image_pdf = Image(blob=read_pdf_file, resolution=300)
image_png = image_pdf.convert('png')
req_image = []
final_text = []
for img in...
1918 просмотров
schedule
04.11.2021
TesseractNotFoundError: C: \ Program Files \ Tesseract-OCR esseract.exe не установлен или находится не на вашем пути
Я запускаю Python через консольную среду Anaconda / Spyder. Версия - 3.7.2 (по умолчанию, 2 января 2019 г., 17:07:39) [MSC v.1915, 64-разрядная версия (AMD64)]
Я выполнил рекомендации из этого сообщения stackoverflow: Ошибка Tesseract Not Found...
454 просмотров
schedule
23.09.2021
Tesseract: проблемы с символом верхнего регистра
Я использую Tesseract с Python. У меня есть изображение с 1-6 словами, и мне нужно прочитать текст. Иногда символ «C», который выглядит одинаково в верхнем и нижнем регистре, определяется как нижний регистр c, а не верхний регистр C. Я вижу...
652 просмотров
schedule
23.09.2021
pyTesseract не выводит текст из изображения
может кто-нибудь мог бы мне помочь! Когда я запускаю следующий код
импортировать pytesseract из pytesseract импортировать image_to_string из PIL импортировать изображение импортировать PIL
file =...
98 просмотров
schedule
19.10.2021
Предварительная обработка изображения перед распознаванием текста с помощью Tesseract
У меня есть отсканированная страница, на которой я пытаюсь определить и проанализировать числа на изображении (строка за строкой). Для этого я использую Python Pytessarect со следующим кодом:
img = cv2.imread('image.jpg',0)
ret,thresh1 =...
74 просмотров
schedule
19.09.2021
Определите передний и задний цвета с помощью OpenCV
Я новичок в Python и OpenCV. У меня есть несколько снимков экрана (прилагается один образец для справки), для которых я хочу определить передний и задний цвет текста. Я буду использовать эти цвета для расчета цветовой контрастности текста....
53 просмотров
schedule
15.09.2021
Как извлечь только определенный текст из файла PDF с помощью Python
Как извлечь часть определенного текста только из файлов PDF с помощью Python и сохранить выходные данные в определенных столбцах Excel.
Вот образец входного PDF-файла (File.pdf)
Ссылка на полный PDF-файл File.pdf
Нам нужно извлечь...
1289 просмотров
schedule
25.09.2021
Вывод Tesseract ocr с одиночными символами между обнаруженным текстом
Я пытаюсь использовать Tesseract для извлечения из изображения ниже,
text = pytesseract.image_to_string(image, config='-c preserve_interword_spaces=1 --psm 1 --oem 1')
Вот результат tesseract 4 ocr,
print(text)
Wrote Datastream...
141 просмотров
schedule
24.11.2021
Обнаруживать только горизонтальный текст с Tesseract
У меня есть изображение с горизонтальным и вертикальным текстом. И я обнаруживаю текст с помощью tesseract OCR. А вот массив, который возвращает тессеракт
'text': ['', '', '', '', 'Some', 'other', 'text', 'horizontal', '', '', '', 'JEDIY9A',...
773 просмотров
schedule
29.09.2021
Как улучшить возможности автоматического поворота текста Tesseract для распознавания текста?
У меня есть набор изображений PIL, где некоторые страницы повернуты правильно, а другие имеют поворот, близкий к 180 °. Это означает, что автоматическое определение ориентации может не сработать, поскольку вместо 178 ° градусов распознается...
2493 просмотров
schedule
28.12.2021
распознавание изображений с использованием pytesseract python
у меня есть изображение, но я не могу узнать цену, это то, что у меня есть
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'
print(pytesseract.image_to_string("local-filename.jpg"))...
133 просмотров
schedule
27.12.2021
построить систему отслеживания и отслеживания с использованием Python и камеры для извлечения текста из ярлыка
Моя проблема в том, что камера настолько медленная и не плавная, что создает проблему для извлечения текста из этикетки в реальном времени. Я хочу знать, как сделать предварительный просмотр камеры более плавным, как с видеокамеры, существует большая...
60 просмотров
schedule
16.01.2022
Как получить текст изображения с помощью Tesseract
Я получил это обрезанное изображение из своего pdf-файла:
После предварительной обработки я передаю его в Tesseract OCR.
text = pytesseract.image_to_string(img, lang='eng')
Но ocr'ed text пуст.
Редактировать:
Я загружаю полное...
393 просмотров
schedule
01.03.2022
Команда tesseract не работает из командной строки в Windows
Я установил tesseract-OCR для Windows, и он находится по пути C: \ Program Files \ Tesseract-OCR в моей системе.
Я установил переменную среды, добавив C: \ Program Files \ Tesseract-OCR в переменную PATH.
Я также установил TESSDATA_PREFIX в...
2793 просмотров
schedule
06.03.2022
мы выполняем Pan OCR, используя tesseract, но не можем определить такие детали, как имя и номер панорамы
Мы обрезаем изображение панорамирования, увеличивая высоту на 20 пикселей для каждой итерации, а затем мы передаем это изображение в tesseract для выполнения ocr, но мы получаем шум с выводом. Если у вас есть лучшее решение для обработки изображений...
2284 просмотров
schedule
20.03.2022
Можно ли проверить ориентацию изображения перед его передачей через модуль pytesseract ocr
Для моего текущего проекта ocr я попытался использовать tesserect, используя pytesseract оболочки python для преобразования изображений в текстовые файлы. До сих пор я передавал в свой модуль только хорошо ориентированные изображения, так как он мог...
11556 просмотров
schedule
30.03.2022
Функция PyTesseract image_to_data не распознает мое изображение
Я использую pytesseract, чтобы вернуть координаты объектов на изображении.
Используя этот фрагмент кода:
import pytesseract
from pytesseract import Output
import cv2
img = cv2.imread('wine.jpg')
d = pytesseract.image_to_data(img,...
2104 просмотров
schedule
27.03.2022
UnicodeDecodeError с Tesseract OCR в Python
Я пытаюсь извлечь текст из файла изображения с помощью Tesseract OCR в Python, но я столкнулся с ошибкой, и я могу понять, как с ней справиться. вся моя среда хороша, так как я тестировал образец изображения с помощью ocr в python!
вот код...
10141 просмотров
schedule
19.04.2022