При синтаксическом анализе кучи html в текстовом формате, является ли регулярное выражение лучшим способом извлечь и проверить все теги привязки или есть ли что-нибудь встроенное в .net lib?
Разбор тегов привязки с помощью asp.net
Ответы (2)
RegEx - это ты, приятель. В BCL нет встроенного парсера HTML.
Если вы вводите его XHTML (или XML-совместимый), вы можете использовать XML и XPath. Загрузка документа в XmlDocument
и выбор всех a
узлы.
person
Oded
schedule
06.01.2010
Регулярное выражение - это хорошо. Однако я считаю, что HTML agility pack немного более снисходительный, и это то, что я бы использовал в этой ситуации. .
person
Joel Cunningham
schedule
06.01.2010