У меня есть проект, который требует, чтобы мы загрузили и прочитали таблицу из Википедии и использовали эту информацию для расчетов. Страница википедии: https://en.wikipedia.org_wiki_mec_me_data_crypt_subscribe.com/Listrate_of_crime_subscribe
требуется, чтобы мы возьмем Общее количество насильственных преступлений для каждого города и штата в списке (состояния повторяются). Однако все ячейки для этих столбцов имеют только теги. он находится под одной таблицей, вопрос в том, как я могу использовать beautifulsoup для чтения того конкретного столбца, который находится под столбцом насильственных преступлений
Я просмотрел Интернет, и я нашел много вариантов здесь и на других веб-сайтах, но они действительно не помогают в этом конкретном случае. Но вот код, который у меня есть в настоящее время, который может принимать все значения из таблицы. большинство переменных являются держателями, пока я тестирую, потому что я занимался этим несколько дней
state = soup.find_all('th', limit = 7)
for row in state:
row_data = row.get_text(strip = True, separator = '|').split('|')[0:1]
outfile.write(str(row_data)+ "\n")
umber = soup.find_all('td')
for column in number:
column_data = column.get_text(strip = True, separator = '|').split('|')[0:1]
outfile.write(str(column_data)+ "\n")
Я в основном хочу сохранить эту информацию в виде списка для последующего использования, а затем использовать ссылки на каждый город и получить их шнуры, а затем сослаться на несколько городов в Техасе для ближайшего к границе
Нам разрешено использовать только BeautifulSoup и CSV, без Pandas или NumPy.
Изменить: функции записи также предназначены только для тестирования. Это только для того, чтобы увидеть, правильно ли он захватывает информацию из таблицы. Моя консоль IDE не может отображать их все, поэтому записать это было следующим лучшим, что я мог придумать.