Вопросы по теме 'html-parser'

Как я могу установить HTML-Parser-3.64 на Perl 5.6?
Я пытаюсь установить HTML-Parser-3.64 и получаю следующий отчет при запуске make test : ERL_DL_NONLAZY=1 /home/Perl/bin/perl -Iblib/arch -Iblib/lib -I/home/Perl/5.6.1-nothread/lib/perl5/5.6.1/sun4.SVR4 -I/home/Perl/5.6.1-nothread/lib/perl5/5.6.1...
2239 просмотров
schedule 09.09.2021

urllib.error.HTTPError: ошибка HTTP 302
Я пытаюсь выполнить синтаксический анализ веб-сайта с помощью Python3.6 с помощью анализатора HTML, но он выдает ошибку ab следующим образом: urllib.error.HTTPError: HTTP-ошибка 302: HTTP-сервер возвратил ошибку перенаправления, которая...
1735 просмотров

Как разобрать вложенную таблицу из ссылки HTML с помощью BeautifulSoup в Python?
Все, Я пытаюсь проанализировать таблицу по этой ссылке http://web1.ncaa.org/stats/StatsSrv/careersearch . Обратите внимание: для поиска в разделе «Поиск школы / спорта» выберите «Все для школы», «Год-2005-2006», «Спорт-футбол», дивизион I....
239 просмотров

могу ли я использовать jsoup для очистки экрана
Я новичок в Jsoup. Я должен очистить экран, чтобы получить иерархию ссылок. Я могу получить ссылки с первой страницы, но мне нужно знать, как я могу углубиться и получить ссылку на каждую ссылку. Это то, что у меня есть до сих пор. Он распечатывает...
787 просмотров
schedule 11.05.2022

используйте HtmlTidy Managed для фрагмента html
я использую эту оболочку библиотеки для HtmlTidy в .net https://github.com/markbeaton/TidyManaged у него есть простой пример: using System; using TidyManaged; public class Test { public static void Main(string[] args) { using...
509 просмотров

Java получает ссылку RSS из исходного кода HTML с использованием JSOUP
Я пытаюсь получить ссылку RSS из исходного кода html. Я использовал java-библиотеку Jsoup , чтобы найти ссылку RSS. Я написал небольшой код для получения RSS-ссылок, но, к сожалению, он работает не на всех сайтах. Ниже мой код String url =...
2653 просмотров
schedule 04.07.2023

Разобрать HTML-страницу, используя ключевые слова в java
У меня есть ссылки на страницы contact_us с веб-сайтов почти 100 компаний. Мне нужно собрать адреса всех компаний, которые есть на каждой странице contact_us . Я пытаюсь использовать Jsoup, но если я использую Jsoup, это будет специфично для...
63 просмотров
schedule 19.09.2023

Разбор элементов HTML по порядку с помощью Jsoup
Используя Jsoup, я пытался анализировать статьи и отображать их в приложениях для Android, программно создавая TextView и ImageView. Я пытаюсь избежать использования макета WebView в Android Studio, поскольку он не предлагает особых настроек. С...
444 просмотров
schedule 22.10.2022

Почему в таблице поисковых запросов отображаются заголовки таблиц, а не данные в BeautifulSoup (Python)?
Я пытаюсь проанализировать эту ссылку для поиска результатов. Пожалуйста выберите: Школа= Все Спорт=Футбол Конференция=Все Год=2005-2006 Состояние = Все Этот результат поиска содержит 226 записей, и я хотел бы проанализировать...
230 просмотров
schedule 03.04.2023

HTMLParser unescape не проходит ‹ или › не экранируется в приложении Pyramid
Название говорит о многом. Python3.3 с использованием фреймворка приложений Pyramid (-s starter). Добавление этого кода в контроллер views.py: from HTMLParser import HTMLParser h = HTMLParser() string = '<p>Hi there!</p>'; return...
343 просмотров