Я пытаюсь запустить приведенный ниже бит кода, чтобы извлечь обзор Yelp.
from lxml import html
import requests
import csv
page = requests.get('http://www.yelp.com/biz/guisados-los-angeles')
review = tree.xpath('//p[@itemprop="description"]/text()')
Теперь у меня есть обзор, как показано ниже
These tacos are the business. We ventured into an unpretentious, relatively small restaurant who offered a photographic menu (VERY helpful) of the different tacos they have.
Вышеупомянутый обзор одного обзора разделен на части, как показано ниже.
[
'These tacos are the business.',
'We ventured into an unpretentious, relatively small restaurant who offered a photographic menu (VERY helpful) of the different tacos they have.
]
Как заставить lxml text()
игнорировать <br>
в комментарии? Любые указатели, пожалуйста?