Я пытаюсь извлечь текстовое содержимое из файлов IDML.
Что я сейчас делаю -
Извлеките файлы xml, перейдите к файлу
designmap.xml
и найдите развороты, из которых состоит документ.Развороты — это элементы в designmap.xml, определенные как ::
- В каждом развороте я ищу
<TextFrame>
элементов и извлекаю соответствующий контент из атрибутаParentStory
.
The problem is that this text does not seem to be in order. I have a simple IDML file, where i have one text frame for the title, and one textframe covers the contents of the page. When I extract, the body part ifs fetched first, and then the header.
Есть ли способ извлечь контент в том же порядке, в котором мы его видим?
Спасибо.
PS. В элементе для атрибутов NextFrame и PreviousFrame установлено значение «n». Я не уверен, что это значит, и могут ли эти значения как-то помочь. Извините, если я упустил здесь что-то очень простое, я новичок в дизайне и IDML.