Я был в процессе написания сценария парсера Python для RSS-каналов. Я использую feedparser, однако я застрял на парсинге каналов из FeedBurner. Кому сейчас нужен FeedBurner? В любом случае..
Например, я не мог найти способ разобрать
http://feeds.wired.com/wired/index
http://feeds2.feedburner.com/ziffdavis/pcmag
Когда я помещаю их в библиотеку feedparser, похоже, что они не работают. Пытался поставить? Fmt = xml или? Format = xml в конце URL-адресов, но все еще не получил формат xml.
Нужно ли мне использовать синтаксический анализатор HTML, такой как BeautifulSoup, для синтаксического анализа каналов FeedBurner? Желательно, существует ли публичный парсер или агрегатор Python скрипт, который уже справляется с этим?
Мы будем благодарны за любой совет или помощь.