Вопросы по теме 'html-agility-pack'

Пакет гибкости Html: установка значения атрибута HtmlNode не отражается в HtmlDocument
В Html Agility Pack, когда я устанавливаю атрибут HtmlNode, должен ли я видеть это в HtmlDocument, из которого был выбран узел? Допустим, htmlDocument - это HtmlDocument. Итак, упрощенный код выглядит так: HtmlNode documentNode =...
4252 просмотров
schedule 18.11.2021

Внутри самого внутреннего тега. Как добиться того, чтобы все операции форматирования текста были эффективными?
Мое требование - получать новостной контент с разных новостных сайтов ... примерно ... 250. поэтому новостной контент находится где-то в теле, я могу перейти к первому абзацу, где новостной контент основан на фрагментах / метаинфо google. но чтобы...
127 просмотров
schedule 09.09.2021

HTML Agility Pack Найдите идентификаторы, начинающиеся с
Я полный новичок в XPath, я делаю приложение для получения данных с веб-сайта, и мне нужно найти 2 вещи: 1- все теги диапазона, которые начинаются с: ctl00_Main_GridView_lieutenants 2- href родительского тега в диапазоне .... ээээ .. Я...
4399 просмотров
schedule 04.11.2021

HTML Parse нет результатов
Я пытаюсь проанализировать этот HTML-документ, чтобы получить содержимое полета, времени, происхождения, даты и вывода. <div id="FlightInfo_FlightInfoUpdatePanel"> <table cellspacing="0" cellpadding="0"> <tbody> <tr...
1211 просмотров

C # HAP как получить перенаправленный URL
Это страница ebay http://www.ebay.com/itm/GRUEN-RUNNING-PRECISION-WRIST-WATCH-/230718830945?pt=Pocket_Watches&hash=item35b7e9f961 Я использую пакет гибкости C #, чтобы получить страницу версии для печати по этой ссылке. Ссылка «Печать»...
1396 просмотров
schedule 25.11.2021

Окружите существующий узел другим узлом с помощью Agility Pack
Как бы вы окружили все таблицы узлом <div class="overflow"></div> ? По-видимому, этого не происходит: if (oldElement.Name == "table") { HtmlDocument doc = new HtmlDocument(); HtmlNode newElement = doc.CreateElement("div");...
3598 просмотров
schedule 10.09.2021

Как я могу добавить webRequest для установки тайм-аута при загрузке URL-адреса документа в HtmlAgilityPack?
У меня есть этот код при загрузке URL: private List<string> test(string url, int levels,DoWorkEventArgs eve) { HtmlWeb hw = new HtmlWeb(); List<string> webSites; try {...
2180 просмотров
schedule 07.09.2021

Узлы поиска XPath HTML
Я использую HtmlAgilityPack, чтобы попытаться найти узлы HTML 'A', которые имеют атрибут href, содержащий определенную строку, в моем случае строку '/ groups /': HtmlNodeCollection groups = source.DocumentNode.SelectNodes("//a[contains(@href,...
91 просмотров
schedule 27.11.2021

Обернуть элемент с помощью HtmlAgilityPack?
У меня есть HtmlDocument , который может иметь или может иметь правильный раздел <head> и <body> или может быть просто фрагментом html. В любом случае, я хочу запустить его через функцию, которая обеспечит (более) правильную...
1471 просмотров
schedule 19.11.2021

Html Agility Pack: получите HTML-документ с Интернет-ресурса и сохраните его в указанном файле.
Я пытаюсь получить html-страницу по этой ссылке и сохранить содержимое в конкретный файл на C #, используя библиотеку классов HAP. Меня забавляет метод Get класса HtmlWeb. Он компилируется и работает отлично, но файл "file.txt" никогда не создается....
8034 просмотров
schedule 19.09.2021

Как читать объект JavaScript с помощью XPath / HTMLAgilityPack
Для моего проекта поискового робота мне нужно получить информацию о продукте из объекта JavaScript. Как я могу эффективно получить подробную информацию об объекте из следующего кода JavaScript? Я использую XPath и HTMLAgilityPack. <script...
3257 просмотров
schedule 09.11.2021

Как работает HtmlNodeNavigator?
Как добиться XPathDocument document = new XPathDocument("books.xml"); XPathNavigator navigator = document.CreateNavigator(); XPathNodeIterator nodeset = navigator.Select(xpath); while (nodeset.MoveNext()) { // Clone iterator here when working...
975 просмотров
schedule 03.11.2021

Добавить узел во внутренний текст с помощью HTMLAgilityPack
Проблема: мне нужно удалить свойство стиля всех тегов <p> и, если оно содержит свойство font-weight:bold , добавить к нему <b> . например: если HTML - это <p style="margin-top:0pt; margin-bottom:0pt;font-weight:bold;...
3587 просмотров
schedule 10.09.2021

извлечение только текста страницы с помощью HTMLAgilityPack
Хорошо, поэтому я действительно новичок в запросах XPath, используемых в HTMLAgilityPack. Итак, давайте рассмотрим эту страницу http://health.yahoo.net/articles/healthcare/what-your-favorite-flavor-says-about-you . Я хочу извлечь только...
3466 просмотров
schedule 17.11.2021

Пакет HTML Agility Выберите все узлы, содержащие XPath
Я новичок в пакете гибкости HTML и разбираюсь в основах XPath. Однако у меня возникла проблема, есть ли способ получить все узлы, содержащие другой тип узла? Например: я хочу получить все <tr> , содержащие тег <a> ? Когда я...
653 просмотров
schedule 16.10.2021

Как я могу записать декодированный HTML с помощью HTMLAgilityPack?
У меня есть частичный успех в моей попытке записать HTML в файл DOCX с помощью HTMLAgilityPack и библиотеки DOCX. Однако текст, который я вставляю в файл .docx, содержит закодированный html, например: La ciudad de Los &Aacute;ngeles...
5182 просмотров
schedule 28.11.2021

Сбор данных таблицы с помощью пакета htmlagility
У меня есть таблица, как показано ниже. Я хочу очистить 1-й и 4-й столбцы каждой строки этой таблицы. Структура таблицы такая: Каждые данные содержат тег b . Я пробовал что-то подобное. Но я не добился своего результата HtmlWeb...
435 просмотров
schedule 13.10.2021

Как исправить неправильно сформированный HTML с помощью HTML Agility Pack?
У меня есть этот плохо сформированный HTML с перекрывающимися тегами: <p>word1<b>word2</p> <p>word3</b>word4</p> Перекрытие тоже может быть вложенным. Как преобразовать его в правильно сформированный...
7399 просмотров
schedule 18.10.2021

Обрабатывать функцию параллельно / асинхронно и добавлять результаты, возвращая один список результатов?
У меня есть функция, которая возвращает строку []. let asyncScrape url allParameters = allParameters |> Seq.map(fun v -> yearAndClassResultsAsync url v) |> Async.Parallel |> Async.RunSynchronously Я...
485 просмотров
schedule 27.09.2021

Извлечь значение таймера с веб-страницы с помощью xPath и C #
Я пытаюсь получить некоторые значения таймера с веб-сайтов, используя xpath в HtmlAgilityPack. Однако, когда я использую xpath, я получаю исключения нулевой ссылки, потому что конкретный узел не существует, когда я его захватываю. Чтобы проверить,...
117 просмотров
schedule 21.11.2021