Редактирование html-файла, такого как xml-файл

Мне нужно преобразовать файл HTML в формат iXBRL. Формат iXBRL в основном представляет собой html с некоторыми встроенными узлами или некоторой информацией из html-файла, завернутой в теги ixbrl. Для этого мне нужно будет ПОИСК и УДАЛИТЬ некоторые узлы из HTML-файла и Обернуть некоторые узлы тегами iXBRL.

Я не могу использовать XML DOM, так как он создает исключение для типа контента. Класс .Net htmldocument не поддерживает удаление узлов и их замену, и я не видел параметр «Сохранить».

Я попытался использовать HTML Agility Pack, но он не может найти узлы из-за пространств имен в имени узла, и у него нет возможности указать пространства имен (линейный менеджер пространств имен в .net).

Могу ли я указать пространство имен в выражении XPATH? Как?

Может ли кто-нибудь помочь мне в редактировании файлов HTML (или XHTML) с использованием .net или любой бесплатной библиотеки.


person Saubhagya    schedule 26.08.2010    source источник
comment
вы должны опубликовать свой ввод XHTML и желаемый вывод XHTML+iXBRL   -  person    schedule 26.08.2010


Ответы (1)


Если вы хотите использовать XPATH с пространствами имен, вам просто нужно добавить к узлам префикс с правильным пространством имен.

Если ваше пространство имен выглядит так:

xmlns:xbrli="http://www.xbrl.org/2003/instance"

И ваши элементы такие:

<root>
<xbrli:elementname></xbrli:elementname>
<root>

Затем вы можете выбрать их в XPATH, например:

//xbrli:elementname
person Chris    schedule 01.03.2011
comment
Пока вы регистрируете URI пространства имен в контексте механизма XPath. - person ; 01.03.2011