Вопросы по теме 'html-agility-pack'
Пакет гибкости Html: установка значения атрибута HtmlNode не отражается в HtmlDocument
В Html Agility Pack, когда я устанавливаю атрибут HtmlNode, должен ли я видеть это в HtmlDocument, из которого был выбран узел?
Допустим, htmlDocument - это HtmlDocument. Итак, упрощенный код выглядит так:
HtmlNode documentNode =...
4252 просмотров
schedule
18.11.2021
Внутри самого внутреннего тега. Как добиться того, чтобы все операции форматирования текста были эффективными?
Мое требование - получать новостной контент с разных новостных сайтов ... примерно ... 250. поэтому новостной контент находится где-то в теле, я могу перейти к первому абзацу, где новостной контент основан на фрагментах / метаинфо google. но чтобы...
127 просмотров
schedule
09.09.2021
HTML Agility Pack Найдите идентификаторы, начинающиеся с
Я полный новичок в XPath, я делаю приложение для получения данных с веб-сайта, и мне нужно найти 2 вещи:
1- все теги диапазона, которые начинаются с: ctl00_Main_GridView_lieutenants
2- href родительского тега в диапазоне .... ээээ .. Я...
4399 просмотров
schedule
04.11.2021
HTML Parse нет результатов
Я пытаюсь проанализировать этот HTML-документ, чтобы получить содержимое полета, времени, происхождения, даты и вывода.
<div id="FlightInfo_FlightInfoUpdatePanel">
<table cellspacing="0" cellpadding="0">
<tbody>
<tr...
1211 просмотров
schedule
03.10.2021
C # HAP как получить перенаправленный URL
Это страница ebay
http://www.ebay.com/itm/GRUEN-RUNNING-PRECISION-WRIST-WATCH-/230718830945?pt=Pocket_Watches&hash=item35b7e9f961
Я использую пакет гибкости C #, чтобы получить страницу версии для печати по этой ссылке. Ссылка «Печать»...
1396 просмотров
schedule
25.11.2021
Окружите существующий узел другим узлом с помощью Agility Pack
Как бы вы окружили все таблицы узлом <div class="overflow"></div> ? По-видимому, этого не происходит:
if (oldElement.Name == "table")
{
HtmlDocument doc = new HtmlDocument();
HtmlNode newElement = doc.CreateElement("div");...
3598 просмотров
schedule
10.09.2021
Как я могу добавить webRequest для установки тайм-аута при загрузке URL-адреса документа в HtmlAgilityPack?
У меня есть этот код при загрузке URL:
private List<string> test(string url, int levels,DoWorkEventArgs eve)
{
HtmlWeb hw = new HtmlWeb();
List<string> webSites;
try
{...
2180 просмотров
schedule
07.09.2021
Узлы поиска XPath HTML
Я использую HtmlAgilityPack, чтобы попытаться найти узлы HTML 'A', которые имеют атрибут href, содержащий определенную строку, в моем случае строку '/ groups /':
HtmlNodeCollection groups = source.DocumentNode.SelectNodes("//a[contains(@href,...
91 просмотров
schedule
27.11.2021
Обернуть элемент с помощью HtmlAgilityPack?
У меня есть HtmlDocument , который может иметь или может иметь правильный раздел <head> и <body> или может быть просто фрагментом html. В любом случае, я хочу запустить его через функцию, которая обеспечит (более) правильную...
1471 просмотров
schedule
19.11.2021
Html Agility Pack: получите HTML-документ с Интернет-ресурса и сохраните его в указанном файле.
Я пытаюсь получить html-страницу по этой ссылке и сохранить содержимое в конкретный файл на C #, используя библиотеку классов HAP. Меня забавляет метод Get класса HtmlWeb. Он компилируется и работает отлично, но файл "file.txt" никогда не создается....
8034 просмотров
schedule
19.09.2021
Как читать объект JavaScript с помощью XPath / HTMLAgilityPack
Для моего проекта поискового робота мне нужно получить информацию о продукте из объекта JavaScript.
Как я могу эффективно получить подробную информацию об объекте из следующего кода JavaScript? Я использую XPath и HTMLAgilityPack.
<script...
3257 просмотров
schedule
09.11.2021
Как работает HtmlNodeNavigator?
Как добиться
XPathDocument document = new XPathDocument("books.xml");
XPathNavigator navigator = document.CreateNavigator();
XPathNodeIterator nodeset = navigator.Select(xpath);
while (nodeset.MoveNext())
{
// Clone iterator here when working...
975 просмотров
schedule
03.11.2021
Добавить узел во внутренний текст с помощью HTMLAgilityPack
Проблема: мне нужно удалить свойство стиля всех тегов <p> и, если оно содержит свойство font-weight:bold , добавить к нему <b> .
например: если HTML - это <p style="margin-top:0pt; margin-bottom:0pt;font-weight:bold;...
3587 просмотров
schedule
10.09.2021
извлечение только текста страницы с помощью HTMLAgilityPack
Хорошо, поэтому я действительно новичок в запросах XPath, используемых в HTMLAgilityPack.
Итак, давайте рассмотрим эту страницу http://health.yahoo.net/articles/healthcare/what-your-favorite-flavor-says-about-you . Я хочу извлечь только...
3466 просмотров
schedule
17.11.2021
Пакет HTML Agility Выберите все узлы, содержащие XPath
Я новичок в пакете гибкости HTML и разбираюсь в основах XPath.
Однако у меня возникла проблема, есть ли способ получить все узлы, содержащие другой тип узла?
Например: я хочу получить все <tr> , содержащие тег <a> ?
Когда я...
653 просмотров
schedule
16.10.2021
Как я могу записать декодированный HTML с помощью HTMLAgilityPack?
У меня есть частичный успех в моей попытке записать HTML в файл DOCX с помощью HTMLAgilityPack и библиотеки DOCX. Однако текст, который я вставляю в файл .docx, содержит закодированный html, например:
La ciudad de Los Ángeles...
5182 просмотров
schedule
28.11.2021
Сбор данных таблицы с помощью пакета htmlagility
У меня есть таблица, как показано ниже. Я хочу очистить 1-й и 4-й столбцы каждой строки этой таблицы.
Структура таблицы такая:
Каждые данные содержат тег b .
Я пробовал что-то подобное. Но я не добился своего результата
HtmlWeb...
435 просмотров
schedule
13.10.2021
Как исправить неправильно сформированный HTML с помощью HTML Agility Pack?
У меня есть этот плохо сформированный HTML с перекрывающимися тегами:
<p>word1<b>word2</p>
<p>word3</b>word4</p>
Перекрытие тоже может быть вложенным.
Как преобразовать его в правильно сформированный...
7399 просмотров
schedule
18.10.2021
Обрабатывать функцию параллельно / асинхронно и добавлять результаты, возвращая один список результатов?
У меня есть функция, которая возвращает строку [].
let asyncScrape url allParameters =
allParameters
|> Seq.map(fun v ->
yearAndClassResultsAsync url v)
|> Async.Parallel
|> Async.RunSynchronously
Я...
485 просмотров
schedule
27.09.2021
Извлечь значение таймера с веб-страницы с помощью xPath и C #
Я пытаюсь получить некоторые значения таймера с веб-сайтов, используя xpath в HtmlAgilityPack. Однако, когда я использую xpath, я получаю исключения нулевой ссылки, потому что конкретный узел не существует, когда я его захватываю. Чтобы проверить,...
117 просмотров
schedule
21.11.2021