Используя PDFTron в Python, удалите все элементы изображения из PDF с заданными характеристиками размера.

Я пытаюсь удалить большое количество очень маленьких изображений из серии PDF-документов, используя потрясающе выглядящую библиотеку PDFTron для Python. По сути, я хочу создать новый PDF-файл, просматривая каждый элемент в существующем PDF-файле и копируя те, которые соответствуют определенным критериям размера, в новый PDF-файл в той же позиции.

Может ли кто-нибудь направить меня к документации PDFTron специально для Python, чтобы помочь мне в этом? Или предоставить пример скрипта, который проверяет размер изображения? Я думаю, что я могу сделать все остальное (акцент на думать). Документация, доступная на веб-сайте PDFTron, не предназначена специально для Python, трудно найти то, что мне нужно...


person Jack Munchen    schedule 29.10.2014    source источник
comment
В настоящее время нет отдельной документации по API Python, но она создается из API C++, который вы можете найти здесь. http://www.pdftron.com/pdfnet/docs/PDFNetC/   -  person Ryan    schedule 30.10.2014


Ответы (1)


Вы можете увидеть из примера ElementEdit, как удалить все изображения из документа:

http://www.pdftron.com/pdfnet/samplecode.html#ElementEdit

Или предоставить пример скрипта, который проверяет размер изображения?

Не могли бы вы уточнить, что вы подразумеваете под «размером изображения»? Если вы имеете в виду размеры изображения, отображаемые на странице PDF, вы можете проверить это с помощью Element.GetBBox. Если вы имеете в виду размеры исходного изображения, вы можете проверить это, используя Element.GetImageWidth и Element.GetImageHeight (см. http://www.pdftron.com/pdfnet/samplecode.html#ImageExtract). Кроме того, Image.GetImageDataSize дает вам размер данных изображения в байтах.

person user3609640    schedule 29.10.2014