Как преобразовать документ Word 2007 в PDF с помощью Apache FOP

В настоящее время я использую Apache FOP и имею таблицу стилей (возможно, из RenderX), которая конвертирует XML-документы Word 2003 (вариант «Сохранено как XML») в PDF. Однако это не работает для XML-документов Word 2007.

Я ищу варианты и / или предложения о том, как выполнить одну из следующих задач -

Получите таблицу стилей, которая преобразует XML-файл Word 2007 в:

  1. Word 2003 XML или

  2. PDF с использованием FOP (с использованием таблицы стилей для создания xsl-fo)

Я также открыт для любых других вариантов, которые могут у вас возникнуть. Если возможно, я хотел бы сделать это практически бесплатно. Однако я ограничен использованием Java, поэтому вариант типа C # невозможен.

Спасибо,


person Pranav Shah    schedule 13.02.2012    source источник


Ответы (2)


Вы можете попробовать docx4j, библиотеку Java с открытым исходным кодом (ASL v2), которая использует FOP для создания PDF-файлов из docx файлы.

person JasonPlutext    schedule 14.02.2012
comment
Спасибо за предложение. Я буду смотреть в него. Однако я надеялся на решение типа таблицы стилей, поскольку оно вписывается в существующую структуру. Переход на docx4j потребует нескольких изменений. - person Pranav Shah; 14.02.2012
comment
docx4j действительно использует XSLT для создания XSL-FO, хотя и с функциями расширения Java. - person JasonPlutext; 28.03.2012

Я не знаю ни одной таблицы стилей, которая выполняет это преобразование. Это было бы достаточно сложно. Если вам придется разработать другой способ сделать это, вы можете посмотреть JODConverter (прямое преобразование - может быть вашим лучшим выбором), OpenOffice UNO API (очень ручной), JODReports или Docmosis (оба могут создавать документы в различных форматах). Все могут создавать PDF-файлы из среды Java. Думаю, у всех есть бесплатные версии.

Надеюсь, это поможет.

person Paul Jowett    schedule 15.03.2012