Разбор тегов привязки с помощью asp.net

При синтаксическом анализе кучи html в текстовом формате, является ли регулярное выражение лучшим способом извлечь и проверить все теги привязки или есть ли что-нибудь встроенное в .net lib?


person maxp    schedule 06.01.2010    source источник


Ответы (2)


RegEx - это ты, приятель. В BCL нет встроенного парсера HTML.

Если вы вводите его XHTML (или XML-совместимый), вы можете использовать XML и XPath. Загрузка документа в XmlDocument и выбор всех a узлы.

person Oded    schedule 06.01.2010

Регулярное выражение - это хорошо. Однако я считаю, что HTML agility pack немного более снисходительный, и это то, что я бы использовал в этой ситуации. .

person Joel Cunningham    schedule 06.01.2010