Вопросы по теме 'bs4'

Анализатор XML BeautifulSoup (bs4) удаляет объекты html
посмотрите на этот пример: # xml parser bs4.BeautifulSoup('<price>&pound;4</price>', 'xml') # prints: <?xml version="1.0" encoding="utf-8"?> <price>4</price> # html (lxml) parser...
590 просмотров
schedule 07.05.2022

Как установить BeautifulSoup4 на python3 на Mac
У меня есть оригинальный Python 2.7.5 в /usr/bin/python, и я установил Python3, загрузив пакет Python 3.5.1 в /usr/local/bin/python3, затем я установил BeautifulSoup4, как показано ниже: sudo easy_install BeautifulSoup4 Searching for...
9995 просмотров
schedule 29.08.2022

Селен и вращающиеся контейнеры
Есть страница с таблицей и кнопка «Далее», которая обновляет таблицу. Теперь я могу извлечь содержимое таблицы, но мне нужно перейти к другим строкам, используя кнопку «Далее». Это какая-то таблица ajax без href для обновления страницы. Таким...
41 просмотров
schedule 27.08.2022

Python/BeautifulSoup – Как извлечь текст между тегами ‹li› и ‹dl›
У меня есть следующий HTML-код <ol> <li>If someone is <b>able</b> to do something, they <a href="/wiki/can" title="can">can</a> do it. <dl> <dd><i>I'm busy today, so I won't be...
2234 просмотров
schedule 02.08.2023

В чем разница beautifulsoup и bs4
Я новичок в python, и я попытался проанализировать некоторые файлы XML, чтобы добавить несколько новых тегов и сохранить этот новый файл XML. python-beautifulsoup кажется подходящим пакетом для этого. Поискав в Интернете учебные пособия о том,...
13758 просмотров
schedule 21.01.2023

Как использовать find() Beautiful Soup вместо find_all() для лучшего времени выполнения
Я пишу веб-скребок, используя Python bs4. Я пытаюсь найти первое изображение с определенным атрибутом 'data-a-dynamic-image'. Пока у меня есть код ниже, и он работает. Но я бы предпочел использовать только find() , а не find_all . Это...
350 просмотров
schedule 26.05.2023

Извлечение нескольких URL-адресов без тегов «a» или «href» с веб-страницы с помощью BS4
Я делаю простую программу с Selenium, которая переходит на Flickr.com, ищет введенный пользователем термин, а затем распечатывает URL-адреса всех этих изображений. Я борюсь с последней частью, получая только URL-адреса изображений. Я использовал...
110 просмотров
schedule 24.03.2023

Доступ к определенной таблице в теге html
Я собираюсь использовать BeautifulSoup, чтобы найти таблицу, которая определена в «логическом определении контента» по следующим ссылкам: 1) https://www.hl7.org/fhir/valueset-account-status.html 2)...
105 просмотров
schedule 02.12.2022

красивый суп фиксирует нулевые значения в таблице
Для следующего фрагмента HTML-кода я использовал BeautifulSoup для захвата табличной информации: <table> <tr> <td><b>Code</b></td> <td><b>Display</b></td> </tr> <tr>...
749 просмотров
schedule 07.02.2023

Использование BeautifulSoup4 с Google Translate
В настоящее время я просматриваю раздел Web Scraping AutomateTheBoringStuff и пытаюсь написать скрипт, который извлекает переведенные слова из Google Translate с помощью BeautifulSoup4. Я просмотрел html-содержимое страницы, где «Пояснение» — это...
1594 просмотров
schedule 18.03.2023

Не удается просмотреть полный исходный код страницы в Selenium
Когда я просматриваю исходный HTML-код после ручного перехода на сайт через Chrome, я вижу полный исходный код страницы, но при загрузке исходного кода через селен я не получаю полный исходный код страницы. from bs4 import BeautifulSoup from...
3454 просмотров
schedule 26.02.2023

Получить данные PubMed из ID с помощью bs4
Я работаю над проектом по загрузке названия, аннотации, года публикации и терминов MeSH из файла CSV, состоящего из ~ 12 000 идентификаторов PubMed. Я написал код ниже: import urllib2 from bs4 import BeautifulSoup import csv CSVfile =...
98 просмотров
schedule 02.08.2023

Python 2.7 BeautifulSoup4 возвращает пустой набор
Я пытаюсь получить ссылки из поиска Google с помощью bs4, но мой код возвращает пустой набор. import requests from bs4 import BeautifulSoup website = "https://www.google.co.uk/?gws_rd=ssl#q=science" response=requests.get(website) soup =...
78 просмотров

Я использую BeautifulSoup и хочу получить значение alt тега img.
Я хочу получить команду соперника на сегодняшнюю игру одной бейсбольной команды. Поэтому я закодировал это. Этот код получает информацию о сегодняшней игре с веб-сайта. from bs4 import BeautifulSoup import datetime import urllib.request req...
1137 просмотров
schedule 22.05.2023

urllib.error.HTTPError: Ошибка HTTP 400: неверный запрос в функции Python
Я делаю программу, которая ищет рецепты на основе определенных входных данных (пока что это ингредиенты). Программа работает, когда я ищу только несколько ингредиентов, но еще несколько возвращают ошибку urllib. Я просмотрел другие вопросы, но они...
1601 просмотров
schedule 14.01.2024