Вопросы по теме 'pdfbox'

Использование Apache Lucene для анализа больших файлов PDF
Я пытаюсь найти лучший способ поиска / анализа набора больших файлов PDF. В настоящее время я использую PDFBox для преобразования файлов PDF в текстовые файлы. Затем я использую Lucene для индексации этих текстовых файлов и поиска информации. Я...
2210 просмотров
schedule 10.09.2021

как читать разрешение PDF в окне PDF
Я могу конвертировать страницы PDF в отдельные изображения. Но я хочу прочитать разрешение (dpi), длину и высоту PDF-файла перед преобразованием в изображения. Пожалуйста, как узнать эти метаданные PDF в Java с помощью pdfbox ?
4031 просмотров
schedule 11.09.2021

Как извлечь цвет шрифта с помощью PDFBOX java?
На самом деле мне нужно извлечь цвет шрифта каждого символа, нашел этот фрагмент кода ниже с форума, но при его выполнении мне выдается ошибка Apr 19, 2013 6:23:45 PM org.apache.pdfbox.util.operator.pagedrawer.FillNonZeroRule process WARNING:...
1949 просмотров
schedule 12.10.2021

pdfbox - добавить визуальную подпись. Ошибка приведения COSObject
В org.apache.pdfbox.pdmodel.interactive.digitalsignature.SignatureOptions есть setVisualSignature метод. Я могу создать визуальную подпись из другого потока PDF, который имеет внешний вид визуальной подписи (чтобы скопировать внешний вид). 1)...
1728 просмотров

выделить текст с помощью pdfbox, когда известно его местоположение в pdf
Предоставляет ли pdfbox некоторую утилиту для выделения текста, когда у меня есть его координаты? Границы текста известны. Я знаю, что есть другие библиотеки, которые предоставляют такую ​​же функциональность, как pdfclown и т. Д. Но...
9063 просмотров
schedule 08.09.2021

извлекать PDF-текст по столбцам
У меня вопрос: Как я могу извлечь текст из файла PDF, который разделен на столбцы таким образом, чтобы я получил результат, разделенный этими столбцами? Предыстория: Я работаю над проектом по анализу текстов (особенно научных текстов). Эти...
5586 просмотров
schedule 19.11.2021

Apache PDFBox - не удается расшифровать PDF
У меня проблема с расшифровкой PDF-документа с помощью Apache PdfBox (v1.8.2) lib. Шифрование работает, но расшифровка с тем же паролем вызывает исключение. (Java 1.6) package com.test; import org.apache.pdfbox.pdmodel.PDDocument; import...
4940 просмотров
schedule 13.09.2021

PDFBox: конвертировать документ в PDDocument
Я создал документ с помощью iText, и я хотел бы преобразовать этот документ (который сохранен как файл PDF) в изображение. Для этого я использую PDFBox, которому требуется PDDocument в качестве входных данных. Я использую следующий код:...
2436 просмотров
schedule 28.09.2021

Рассчитать правильную ширину текста
Мне нужно прочитать план, экспортированный AutoCAD в PDF, и разместить на нем несколько маркеров с текстом с помощью PDFBox. Все работает нормально, кроме расчета ширины текста, который написан рядом с маркерами. Я просмотрел всю спецификацию PDF...
3869 просмотров
schedule 31.10.2021

pdfbox и itext извлекают изображение с неправильным dpi
Когда я извлекаю изображение с помощью pdfbox, я получаю неправильное dpi изображения для некоторых PDF-файлов. Когда я извлекаю изображение с помощью Photoshop или Acrobat Reader Pro, я вижу, что dpi изображения составляет 200 с помощью средства...
1622 просмотров
schedule 22.09.2021

Как подложить поток контента с помощью PDPageContentStream?
Я пытаюсь создать водяной знак с помощью PDPageContentStream. Это то, что у меня есть прямо сейчас PDPageContentStream contentStream = new PDPageContentStream(doc,page, true,true); contentStream.beginText(); contentStream.setFont(font,40);...
1376 просмотров
schedule 27.11.2021

Сохранение TextArea как PDF с помощью Java 8 и PDFBox
Я пытаюсь сохранить TextArea как PDF с помощью PDFBox с Java 8. Файл сохраняется и открывается нормально. Но в файле TextArea хранится как одна строка. Я попытался разделить TextArea и пропустить его с помощью drawString для каждого разделения, но...
1148 просмотров
schedule 13.11.2021

PDFBox 1.8.10: заполнить и подписать документ, повторное заполнение не удается
В моем предыдущем вопросе SO PDFBox 1.8.10: «Заполнить и подписать PDF» дает неверные подписи Я объяснил, как мне не удалось заполнить, а затем подписать PDF-документ, используя PDFBox 1.8.10. После того, как с этим разобрались с какой-то помощью,...
1459 просмотров
schedule 18.09.2021

как добавить фоновое изображение в PDF с помощью PDFBox?
Я использую Java PDFBox версии 2.0. Я хочу знать, как добавить фоновое изображение в pdf. Я не могу найти хороший пример в pdfbox.apache.org
2646 просмотров
schedule 06.11.2021

JavaFX: Exception = ›java.lang.NoClassDefFoundError
Я новичок в создании и развертывании Java-приложений. Я разработал приложение, которое должно создавать PDF-документ. Для этой цели я использую pdfbox-library из apache . Для сборки приложения я использую ant. Если я запускаю приложение на...
3456 просмотров
schedule 11.09.2021

PDFBox: разница между PDPage и PDPageNode
Итак, я новичок в PDFBox, и я пишу класс, который использует эту библиотеку для добавления изображения в определенные координаты на существующей странице документа PDF. Пока все идет отлично, но меня беспокоит одна вещь. PDDocument doc =...
482 просмотров
schedule 23.11.2021

слияние файлов дает ошибку: конец файла, ожидаемая строка
Я использую PdfBox для android , чтобы добавлять данные в PDF файл. Данные для добавления public byte [] prerparePdfToAppend() { final PDDocument document = new PDDocument(); final PDPage sourcePage = new PDPage();...
12240 просмотров
schedule 17.11.2021

Поле подписи PDFBox плохо распознается
У меня проблемы с использованием PDFBox 2.0.0-RC3 и созданием поля цифровой подписи в PDF. Я использую этот фрагмент кода: public static void main(String[] args) throws IOException, URISyntaxException { PDDocument document; document =...
644 просмотров
schedule 06.09.2021

Совместимость среды выполнения BIRT 4.3.1 с PDFBox jar
Я использую PDFBox jar для печати PDF-файла, созданного из моего модуля BIRT. Версия BIRT - 4.3.1, которую я планирую обновить. Я просто хотел знать, что BIRT использует внутри себя PDFBox или IText для создания PDF. Если я использую PDFBox с BIRT...
154 просмотров
schedule 31.10.2021

Архивирование электронной почты с помощью camel (таленд)
Мое требование: после прочтения электронной почты мне нужно заархивировать его как PDF (на данный момент давайте рассмотрим простой текст и исключим встроенный текст из изображений). Ниже приведен мой маршрут кода, созданный из Talend-ESB (который,...
149 просмотров
schedule 01.12.2021