Статьи по теме bs4 [python, xml, beautifulsoup, html-entities, bs4]

Вопросы по теме 'bs4'

Анализатор XML BeautifulSoup (bs4) удаляет объекты html

посмотрите на этот пример: # xml parser bs4.BeautifulSoup('<price>£4</price>', 'xml') # prints: <?xml version="1.0" encoding="utf-8"?> <price>4</price> # html (lxml) parser...

590 просмотров

07.05.2022

Как установить BeautifulSoup4 на python3 на Mac

У меня есть оригинальный Python 2.7.5 в /usr/bin/python, и я установил Python3, загрузив пакет Python 3.5.1 в /usr/local/bin/python3, затем я установил BeautifulSoup4, как показано ниже: sudo easy_install BeautifulSoup4 Searching for...

9995 просмотров

python-3.x python-2.7 beautifulsoup bs4

29.08.2022

Селен и вращающиеся контейнеры

Есть страница с таблицей и кнопка «Далее», которая обновляет таблицу. Теперь я могу извлечь содержимое таблицы, но мне нужно перейти к другим строкам, используя кнопку «Далее». Это какая-то таблица ajax без href для обновления страницы. Таким...

41 просмотров

python parsing web-scraping selenium bs4

27.08.2022

Python/BeautifulSoup – Как извлечь текст между тегами ‹li› и ‹dl›

У меня есть следующий HTML-код <ol> <li>If someone is able to do something, they <a href="/wiki/can" title="can">can</a> do it. <dl> <dd>I'm busy today, so I won't be...

2234 просмотров

python beautifulsoup html-parsing bs4

02.08.2023

В чем разница beautifulsoup и bs4

Я новичок в python, и я попытался проанализировать некоторые файлы XML, чтобы добавить несколько новых тегов и сохранить этот новый файл XML. python-beautifulsoup кажется подходящим пакетом для этого. Поискав в Интернете учебные пособия о том,...

13758 просмотров

python-3.x python xml beautifulsoup bs4

21.01.2023

Как использовать find() Beautiful Soup вместо find_all() для лучшего времени выполнения

Я пишу веб-скребок, используя Python bs4. Я пытаюсь найти первое изображение с определенным атрибутом 'data-a-dynamic-image'. Пока у меня есть код ниже, и он работает. Но я бы предпочел использовать только find() , а не find_all . Это...

350 просмотров

python beautifulsoup find findall bs4

26.05.2023

Извлечение нескольких URL-адресов без тегов «a» или «href» с веб-страницы с помощью BS4

Я делаю простую программу с Selenium, которая переходит на Flickr.com, ищет введенный пользователем термин, а затем распечатывает URL-адреса всех этих изображений. Я борюсь с последней частью, получая только URL-адреса изображений. Я использовал...

110 просмотров

python beautifulsoup regex bs4

24.03.2023

Доступ к определенной таблице в теге html

Я собираюсь использовать BeautifulSoup, чтобы найти таблицу, которая определена в «логическом определении контента» по следующим ссылкам: 1) https://www.hl7.org/fhir/valueset-account-status.html 2)...

105 просмотров

python mysql html beautifulsoup bs4

02.12.2022

красивый суп фиксирует нулевые значения в таблице

Для следующего фрагмента HTML-кода я использовал BeautifulSoup для захвата табличной информации: <table> <tr> <td>Code</td> <td>Display</td> </tr> <tr>...

749 просмотров

html-table bs4

07.02.2023

Использование BeautifulSoup4 с Google Translate

В настоящее время я просматриваю раздел Web Scraping AutomateTheBoringStuff и пытаюсь написать скрипт, который извлекает переведенные слова из Google Translate с помощью BeautifulSoup4. Я просмотрел html-содержимое страницы, где «Пояснение» — это...

1594 просмотров

python html beautifulsoup bs4

18.03.2023

Не удается просмотреть полный исходный код страницы в Selenium

Когда я просматриваю исходный HTML-код после ручного перехода на сайт через Chrome, я вижу полный исходный код страницы, но при загрузке исходного кода через селен я не получаю полный исходный код страницы. from bs4 import BeautifulSoup from...

3454 просмотров

python selenium selenium-webdriver bs4

26.02.2023

Получить данные PubMed из ID с помощью bs4

Я работаю над проектом по загрузке названия, аннотации, года публикации и терминов MeSH из файла CSV, состоящего из ~ 12 000 идентификаторов PubMed. Я написал код ниже: import urllib2 from bs4 import BeautifulSoup import csv CSVfile =...

98 просмотров

python csv urllib2 pubmed bs4

02.08.2023

Python 2.7 BeautifulSoup4 возвращает пустой набор

Я пытаюсь получить ссылки из поиска Google с помощью bs4, но мой код возвращает пустой набор. import requests from bs4 import BeautifulSoup website = "https://www.google.co.uk/?gws_rd=ssl#q=science" response=requests.get(website) soup =...

78 просмотров

python-2.7 python-requests beautifulsoup bs4

18.01.2023

Я использую BeautifulSoup и хочу получить значение alt тега img.

Я хочу получить команду соперника на сегодняшнюю игру одной бейсбольной команды. Поэтому я закодировал это. Этот код получает информацию о сегодняшней игре с веб-сайта. from bs4 import BeautifulSoup import datetime import urllib.request req...

1137 просмотров

python bs4

22.05.2023

urllib.error.HTTPError: Ошибка HTTP 400: неверный запрос в функции Python

Я делаю программу, которая ищет рецепты на основе определенных входных данных (пока что это ингредиенты). Программа работает, когда я ищу только несколько ингредиентов, но еще несколько возвращают ошибку urllib. Я просмотрел другие вопросы, но они...

1601 просмотров

python function urllib python-3.5 bs4

14.01.2024