Вопросы по теме 'pdfbox'
Использование Apache Lucene для анализа больших файлов PDF
Я пытаюсь найти лучший способ поиска / анализа набора больших файлов PDF. В настоящее время я использую PDFBox для преобразования файлов PDF в текстовые файлы. Затем я использую Lucene для индексации этих текстовых файлов и поиска информации. Я...
2210 просмотров
schedule
10.09.2021
как читать разрешение PDF в окне PDF
Я могу конвертировать страницы PDF в отдельные изображения. Но я хочу прочитать разрешение (dpi), длину и высоту PDF-файла перед преобразованием в изображения. Пожалуйста, как узнать эти метаданные PDF в Java с помощью pdfbox ?
4031 просмотров
schedule
11.09.2021
Как извлечь цвет шрифта с помощью PDFBOX java?
На самом деле мне нужно извлечь цвет шрифта каждого символа, нашел этот фрагмент кода ниже с форума, но при его выполнении мне выдается ошибка
Apr 19, 2013 6:23:45 PM org.apache.pdfbox.util.operator.pagedrawer.FillNonZeroRule process
WARNING:...
1949 просмотров
schedule
12.10.2021
pdfbox - добавить визуальную подпись. Ошибка приведения COSObject
В org.apache.pdfbox.pdmodel.interactive.digitalsignature.SignatureOptions есть setVisualSignature метод. Я могу создать визуальную подпись из другого потока PDF, который имеет внешний вид визуальной подписи (чтобы скопировать внешний вид).
1)...
1728 просмотров
schedule
01.10.2021
выделить текст с помощью pdfbox, когда известно его местоположение в pdf
Предоставляет ли pdfbox некоторую утилиту для выделения текста, когда у меня есть его координаты?
Границы текста известны.
Я знаю, что есть другие библиотеки, которые предоставляют такую же функциональность, как pdfclown и т. Д. Но...
9063 просмотров
schedule
08.09.2021
извлекать PDF-текст по столбцам
У меня вопрос:
Как я могу извлечь текст из файла PDF, который разделен на столбцы таким образом, чтобы я получил результат, разделенный этими столбцами?
Предыстория: Я работаю над проектом по анализу текстов (особенно научных текстов). Эти...
5586 просмотров
schedule
19.11.2021
Apache PDFBox - не удается расшифровать PDF
У меня проблема с расшифровкой PDF-документа с помощью Apache PdfBox (v1.8.2) lib. Шифрование работает, но расшифровка с тем же паролем вызывает исключение. (Java 1.6)
package com.test;
import org.apache.pdfbox.pdmodel.PDDocument;
import...
4940 просмотров
schedule
13.09.2021
PDFBox: конвертировать документ в PDDocument
Я создал документ с помощью iText, и я хотел бы преобразовать этот документ (который сохранен как файл PDF) в изображение. Для этого я использую PDFBox, которому требуется PDDocument в качестве входных данных. Я использую следующий код:...
2436 просмотров
schedule
28.09.2021
Рассчитать правильную ширину текста
Мне нужно прочитать план, экспортированный AutoCAD в PDF, и разместить на нем несколько маркеров с текстом с помощью PDFBox. Все работает нормально, кроме расчета ширины текста, который написан рядом с маркерами.
Я просмотрел всю спецификацию PDF...
3869 просмотров
schedule
31.10.2021
pdfbox и itext извлекают изображение с неправильным dpi
Когда я извлекаю изображение с помощью pdfbox, я получаю неправильное dpi изображения для некоторых PDF-файлов. Когда я извлекаю изображение с помощью Photoshop или Acrobat Reader Pro, я вижу, что dpi изображения составляет 200 с помощью средства...
1622 просмотров
schedule
22.09.2021
Как подложить поток контента с помощью PDPageContentStream?
Я пытаюсь создать водяной знак с помощью PDPageContentStream. Это то, что у меня есть прямо сейчас
PDPageContentStream contentStream = new PDPageContentStream(doc,page, true,true);
contentStream.beginText();
contentStream.setFont(font,40);...
1376 просмотров
schedule
27.11.2021
Сохранение TextArea как PDF с помощью Java 8 и PDFBox
Я пытаюсь сохранить TextArea как PDF с помощью PDFBox с Java 8. Файл сохраняется и открывается нормально. Но в файле TextArea хранится как одна строка. Я попытался разделить TextArea и пропустить его с помощью drawString для каждого разделения, но...
1148 просмотров
schedule
13.11.2021
PDFBox 1.8.10: заполнить и подписать документ, повторное заполнение не удается
В моем предыдущем вопросе SO PDFBox 1.8.10: «Заполнить и подписать PDF» дает неверные подписи Я объяснил, как мне не удалось заполнить, а затем подписать PDF-документ, используя PDFBox 1.8.10. После того, как с этим разобрались с какой-то помощью,...
1459 просмотров
schedule
18.09.2021
как добавить фоновое изображение в PDF с помощью PDFBox?
Я использую Java PDFBox версии 2.0. Я хочу знать, как добавить фоновое изображение в pdf. Я не могу найти хороший пример в pdfbox.apache.org
2646 просмотров
schedule
06.11.2021
JavaFX: Exception = ›java.lang.NoClassDefFoundError
Я новичок в создании и развертывании Java-приложений. Я разработал приложение, которое должно создавать PDF-документ. Для этой цели я использую pdfbox-library из apache . Для сборки приложения я использую ant.
Если я запускаю приложение на...
3456 просмотров
schedule
11.09.2021
PDFBox: разница между PDPage и PDPageNode
Итак, я новичок в PDFBox, и я пишу класс, который использует эту библиотеку для добавления изображения в определенные координаты на существующей странице документа PDF.
Пока все идет отлично, но меня беспокоит одна вещь.
PDDocument doc =...
482 просмотров
schedule
23.11.2021
слияние файлов дает ошибку: конец файла, ожидаемая строка
Я использую PdfBox для android , чтобы добавлять данные в PDF файл.
Данные для добавления
public byte [] prerparePdfToAppend() {
final PDDocument document = new PDDocument();
final PDPage sourcePage = new PDPage();...
12240 просмотров
schedule
17.11.2021
Поле подписи PDFBox плохо распознается
У меня проблемы с использованием PDFBox 2.0.0-RC3 и созданием поля цифровой подписи в PDF.
Я использую этот фрагмент кода:
public static void main(String[] args) throws IOException, URISyntaxException
{
PDDocument document;
document =...
644 просмотров
schedule
06.09.2021
Совместимость среды выполнения BIRT 4.3.1 с PDFBox jar
Я использую PDFBox jar для печати PDF-файла, созданного из моего модуля BIRT. Версия BIRT - 4.3.1, которую я планирую обновить. Я просто хотел знать, что BIRT использует внутри себя PDFBox или IText для создания PDF. Если я использую PDFBox с BIRT...
154 просмотров
schedule
31.10.2021
Архивирование электронной почты с помощью camel (таленд)
Мое требование: после прочтения электронной почты мне нужно заархивировать его как PDF (на данный момент давайте рассмотрим простой текст и исключим встроенный текст из изображений).
Ниже приведен мой маршрут кода, созданный из Talend-ESB (который,...
149 просмотров
schedule
01.12.2021