Вопросы по теме 'bs4'
Анализатор XML BeautifulSoup (bs4) удаляет объекты html
посмотрите на этот пример:
# xml parser
bs4.BeautifulSoup('<price>£4</price>', 'xml')
# prints:
<?xml version="1.0" encoding="utf-8"?>
<price>4</price>
# html (lxml) parser...
590 просмотров
schedule
07.05.2022
Как установить BeautifulSoup4 на python3 на Mac
У меня есть оригинальный Python 2.7.5 в /usr/bin/python, и я установил Python3, загрузив пакет Python 3.5.1 в /usr/local/bin/python3, затем я установил BeautifulSoup4, как показано ниже:
sudo easy_install BeautifulSoup4
Searching for...
9995 просмотров
schedule
29.08.2022
Селен и вращающиеся контейнеры
Есть страница с таблицей и кнопка «Далее», которая обновляет таблицу. Теперь я могу извлечь содержимое таблицы, но мне нужно перейти к другим строкам, используя кнопку «Далее». Это какая-то таблица ajax без href для обновления страницы. Таким...
41 просмотров
schedule
27.08.2022
Python/BeautifulSoup – Как извлечь текст между тегами ‹li› и ‹dl›
У меня есть следующий HTML-код
<ol>
<li>If someone is <b>able</b> to do something, they <a href="/wiki/can" title="can">can</a> do it.
<dl>
<dd><i>I'm busy today, so I won't be...
2234 просмотров
schedule
02.08.2023
В чем разница beautifulsoup и bs4
Я новичок в python, и я попытался проанализировать некоторые файлы XML, чтобы добавить несколько новых тегов и сохранить этот новый файл XML.
python-beautifulsoup кажется подходящим пакетом для этого. Поискав в Интернете учебные пособия о том,...
13758 просмотров
schedule
21.01.2023
Как использовать find() Beautiful Soup вместо find_all() для лучшего времени выполнения
Я пишу веб-скребок, используя Python bs4. Я пытаюсь найти первое изображение с определенным атрибутом 'data-a-dynamic-image'. Пока у меня есть код ниже, и он работает. Но я бы предпочел использовать только find() , а не find_all . Это...
350 просмотров
schedule
26.05.2023
Извлечение нескольких URL-адресов без тегов «a» или «href» с веб-страницы с помощью BS4
Я делаю простую программу с Selenium, которая переходит на Flickr.com, ищет введенный пользователем термин, а затем распечатывает URL-адреса всех этих изображений.
Я борюсь с последней частью, получая только URL-адреса изображений. Я использовал...
110 просмотров
schedule
24.03.2023
Доступ к определенной таблице в теге html
Я собираюсь использовать BeautifulSoup, чтобы найти таблицу, которая определена в «логическом определении контента» по следующим ссылкам:
1) https://www.hl7.org/fhir/valueset-account-status.html
2)...
105 просмотров
schedule
02.12.2022
красивый суп фиксирует нулевые значения в таблице
Для следующего фрагмента HTML-кода я использовал BeautifulSoup для захвата табличной информации:
<table>
<tr>
<td><b>Code</b></td>
<td><b>Display</b></td>
</tr>
<tr>...
749 просмотров
schedule
07.02.2023
Использование BeautifulSoup4 с Google Translate
В настоящее время я просматриваю раздел Web Scraping AutomateTheBoringStuff и пытаюсь написать скрипт, который извлекает переведенные слова из Google Translate с помощью BeautifulSoup4.
Я просмотрел html-содержимое страницы, где «Пояснение» — это...
1594 просмотров
schedule
18.03.2023
Не удается просмотреть полный исходный код страницы в Selenium
Когда я просматриваю исходный HTML-код после ручного перехода на сайт через Chrome, я вижу полный исходный код страницы, но при загрузке исходного кода через селен я не получаю полный исходный код страницы.
from bs4 import BeautifulSoup
from...
3454 просмотров
schedule
26.02.2023
Получить данные PubMed из ID с помощью bs4
Я работаю над проектом по загрузке названия, аннотации, года публикации и терминов MeSH из файла CSV, состоящего из ~ 12 000 идентификаторов PubMed. Я написал код ниже:
import urllib2
from bs4 import BeautifulSoup
import csv
CSVfile =...
98 просмотров
schedule
02.08.2023
Python 2.7 BeautifulSoup4 возвращает пустой набор
Я пытаюсь получить ссылки из поиска Google с помощью bs4, но мой код возвращает пустой набор.
import requests
from bs4 import BeautifulSoup
website = "https://www.google.co.uk/?gws_rd=ssl#q=science"
response=requests.get(website)
soup =...
78 просмотров
schedule
18.01.2023
Я использую BeautifulSoup и хочу получить значение alt тега img.
Я хочу получить команду соперника на сегодняшнюю игру одной бейсбольной команды.
Поэтому я закодировал это.
Этот код получает информацию о сегодняшней игре с веб-сайта.
from bs4 import BeautifulSoup
import datetime
import urllib.request
req...
1137 просмотров
schedule
22.05.2023
urllib.error.HTTPError: Ошибка HTTP 400: неверный запрос в функции Python
Я делаю программу, которая ищет рецепты на основе определенных входных данных (пока что это ингредиенты). Программа работает, когда я ищу только несколько ингредиентов, но еще несколько возвращают ошибку urllib. Я просмотрел другие вопросы, но они...
1601 просмотров
schedule
14.01.2024