Вопросы по теме 'doc'

Чтение документов Microsoft Word в виде обычного текста (DOC, DOCX) на Java
Я ищу что-нибудь на Java для чтения в документах Word для обработки их текста ... все, что мне нужно, это текст, ничего особенного. Я знаю про Apache POI, но сейчас он не поддерживает DOCX, что-нибудь там есть?
9377 просмотров
schedule 10.11.2021

Как читать текстовые документы, выделенные полужирным шрифтом и курсивом, с помощью POI
Я использую Apache POI. Я могу читать текст из файла документа с помощью "org.apache.poi.hwpf.extractor.WordExtractor" Даже получил таблицы с помощью "org.apache.poi.hwpf.usermodel.Table" Но, пожалуйста, подскажите, как мне получить...
3618 просмотров
schedule 21.09.2021

Файл документа Apache POI дешифрования не может обрабатывать зашифрованный файл?
public static void decryptedDoc(String path,String[] password) throws FileNotFoundException, IOException{ FileOutputStream fileOut = null; for(int i=0;i<password.length;i++){ // try{ Biff8EncryptionKey.setCurrentUserPassword(password[i]);...
1356 просмотров
schedule 13.09.2021

Как повторить шаблон текстового документа для нескольких записей в BIRT RPT
У меня есть шаблон слова. Мне нужно заполнить данные на основе ответа веб-службы. Если в ответе есть несколько записей, мне нужно создать несколько страниц одного и того же шаблона в одном документе вместо создания нескольких файлов. как я могу...
113 просмотров
schedule 27.11.2021

AttributeError: объект 'spacy.tokens.doc.Doc' не имеет атрибута 'lower'
Я работаю над добавлением текстов в список, а затем меняю тексты на вложения слов, а затем занимаюсь машинным обучением. «Insts» в «статьях» собираются с помощью spacy, но затем я столкнулся с этой ошибкой, как показано ниже. Кто-нибудь может сказать...
4780 просмотров
schedule 22.10.2021

Apache POI - преобразование * .doc в * .html с изображениями
Есть файл DOC, содержащий какое-то изображение. Как преобразовать его в HTML с изображением? Я попытался использовать этот пример: Преобразовать документ Word в HTML программно на Java public class Converter { ... private File...
11795 просмотров
schedule 23.02.2022

Чтение текстовых документов с C # и отображение их в браузере
Q 1. Как я могу читать документы MS-Word (doc и docx) с C # без установленного MS Office. Я смог прочитать неформатированный текст с помощью потокового ридера. Я думаю, что могу использовать OpenXML для docx. А как насчет док? Есть ли...
1744 просмотров
schedule 09.03.2022

извлечь текст из .doc (не docx)
Я проверил мои вопросы и ответы в stackoverflow и других, есть много способов открыть и прочитать файл .docx, а не документ, с помощью python. Я уже проверил библиотеку python-docx, но она поддерживает только docx. Я хочу открыть и извлечь текст...
496 просмотров
schedule 05.03.2022

iTextSharp - конвертирует word doc / docx в pdf
Я понимаю, что iTextSharp можно использовать для преобразования документа в PDF. Но сначала нам нужно создать документ с нуля, используя iTextSharp.text.Document, а затем добавить элементы в этот документ. Что делать, если у меня есть...
86088 просмотров
schedule 07.04.2022

Слияние почты с Java
Есть ли у кого-нибудь опыт слияния почты с Java в текстовом документе? Мне нужно поддерживать форматы doc и docx. Я слышал об Apache POI и docx4j. Тем не менее, прочитав все, я уверен, насколько хороша поддержка слов в POI. Насколько я вижу,...
12363 просмотров
schedule 21.04.2022

Apache POI: Word получает размеры изображения
Я пытаюсь определить фактический размер встроенных изображений в документах MS Word, используя HWPFDocument docB = new HWPFDocument(fileInputStream); PicturesTable picB = docB.getPicturesTable(); List picturesB =...
1091 просмотров
schedule 15.04.2022

Процессор Nifi не сохраняет расширение файла
У меня есть поток Nifi, в котором файл документа, например / pdf, doc и т. Д., Отправляется из REST API в процессор Nifi ListenHTTP. Процессор настроен на прием всех заголовков. Вот моя проблема Действия по воспроизведению: hello-world.pdf...
79 просмотров
schedule 21.04.2022

Преобразовать HTML и CSS в DOC(X)?
Есть ли какая-нибудь утилита, которую можно вызвать через командную строку для создания файла doc(x)? Исходный файл будет HTML и CSS. Я пытаюсь генерировать документы Word на лету с помощью PHP. Я знаю только библиотеку phpdocx, которая очень...
14644 просмотров
schedule 25.04.2022

Создание и редактирование документов MS-Word на сервере Linux?
Хотите разработать серверное приложение, которое будет обрабатывать документы. Исходные документы - это в основном MS-Word 2003, 2007, то есть версия Docx для MS. Хотите, чтобы серверное приложение могло работать как в Linux, так и в Windows....
2074 просмотров
schedule 09.05.2022

Ошибка запуска при вводе параметра в bat-скрипт
Я пытаюсь преобразовать несколько файлов .doc в файлы .docx и нашел решение: for %F in (*.doc) do "C:\Program Files\Microsoft Office\Office12\wordconv.exe" -oice -nme "%F" "%Fx" Для получения подробной...
57 просмотров
schedule 08.05.2022

как сделать постформатирование для преобразования DOC/DOCX в HTML?
В настоящее время я использую OpenOffice (командная строка) и JODConvertor для преобразования документов Word (как .doc, так и .docx) в HTML для веб-приложения, которое я размещаю. Он отлично работает, за исключением одной проблемы — HTML-файлы...
1037 просмотров
schedule 26.05.2022

сохранить загруженный файл .doc в базу данных в формате html
В моем приложении пользователь может загружать некоторые файлы документов на сервер, и я хочу, чтобы пользователь, который не устанавливает MS Office, мог читать эти документы, поэтому я хочу преобразовать .doc в html, а затем сохранить html (двоичный...
568 просмотров
schedule 11.06.2022

Android, как открыть файл с расширением .doc?
Есть ли способ открыть файл с расширением .doc?
61833 просмотров
schedule 20.06.2022

Java byteArray[] в docx
doc-файл типа byte[] . Можно ли преобразовать его из byte[] в файл .docx. пробовал просто изменить расширение файла программно, но это не работает. какие-либо предложения? Я создаю отчет, используя код BiRT eclipse для сохранения документа:...
1612 просмотров
schedule 10.07.2022

как получить html-код из pdf, docx, doc с помощью php
Я хочу преобразовать любой файл pdf, docx, doc в html-код, используя php. в том же стиле, что и в pdf. Я не получаю правильного решения. Config::set('pdftohtml.bin', 'C:/poppler-0.37/bin/pdftohtml.exe');...
1978 просмотров
schedule 23.07.2022