Я пытаюсь выбрать заголовок раздела «Свойства» в этой заявке размером 10 КБ; и после выбора оттуда я намереваюсь захватить текст в этом разделе (то есть весь текст между заголовками разделов «Свойства» и «Юридические разбирательства».
Когда я запускаю приведенный ниже код, я получаю IndexError «индекс списка вне диапазона», но я не понимаю, почему, поскольку текст PROPERTIES кажется внутри тега «p». Я также пытался использовать «id=ITEM_2_PROPERTIES» вместо text=, но это тоже не сработало.
Где я ошибаюсь?
import requests
from bs4 import BeautifulSoup
url = 'https://www.sec.gov/ix?doc=/Archives/edgar/data/1318605/000156459020004475/tsla-10k_20191231.htm'
soup = BeautifulSoup(requests.get(url).content, 'lxml')
properties_header = soup.find_all('p', text="PROPERTIES")[0]
print(properties_header)