RSS-канал Simplexml и PHP для новичков

Я слежу за ответом на одно из моих предыдущих сообщений (Показать RSS feed item в интрасети через php) и пытаюсь обучить себя.

Я получаю данные сейчас, но как мне получить «полную запись / историю», мне кажется, что я могу получить только заголовок и описание:

$a = curl_init("");
curl_setopt($a, CURLOPT_RETURNTRANSFER,1);
$b = curl_exec($a);
$xml = simplexml_load_string($b);
print "<pre>";
    print "</pre>";

И вот мой результат:

SimpleXMLElement Object
    [@attributes] => Array
            [version] => 2.0

    [channel] => SimpleXMLElement Object
            [title] => BBC On This Day | Front Page
            [link] =>
            [description] => SimpleXMLElement Object

            [language] => en-gb
            [lastBuildDate] => Mon, 25 Oct 2010 00:15:09 GMT
            [copyright] => Copyright: (C) British Broadcasting Corporation,
            [docs] =>
            [ttl] => 15
            [image] => SimpleXMLElement Object
                    [title] => BBC On This Day
                    [url] =>
                    [link] =>

            [item] => Array
                    [0] => SimpleXMLElement Object
                            [title] => 1983: US troops invade Grenada
                            [description] => American forces seize control of the Caribbean island of Grenada less than a week after a left-wing coup in which the prime minister, Maurice Bishop, was killed.
                            [link] =>
                            [guid] =>
                            [pubDate] => Fri, 24 Oct 2003 08:35:04 GMT
                            [category] => 25

                    [1] => SimpleXMLElement Object
                            [title] => 1964: President Kaunda takes power in Zambia
                            [description] => Zambia is the ninth African state to gain independence from the British crown.
                            [link] =>
                            [guid] =>
                            [pubDate] => Thu, 06 Feb 2003 16:40:25 GMT
                            [category] => 25

                    [2] => SimpleXMLElement Object
                            [title] => 1984: Europe grants emergency aid for Ethiopia
                            [description] => The EEC is donating £1.8 million to help combat the famine in Ethiopia.
                            [link] =>
                            [guid] =>
                            [pubDate] => Thu, 14 Nov 2002 17:55:28 GMT
                            [category] => 25

                    [3] => SimpleXMLElement Object
                            [title] => 1976: Queen opens National Theatre in London
                            [description] => The Queen has officially opened the National Theatre on the South Bank in London after years of delays.
                            [link] =>
                            [guid] =>
                            [pubDate] => Thu, 14 Nov 2002 17:45:57 GMT
                            [category] => 25

                    [4] => SimpleXMLElement Object
                            [title] => 2001: Crime rates lowest for 20 years
                            [description] => British Crime Survey reveals the chances of being a victim of crime are lowest for 20 years.
                            [link] =>
                            [guid] =>
                            [pubDate] => Thu, 14 Nov 2002 17:42:23 GMT
                            [category] => 25




person Wilest    schedule 18.05.2012    source источник
возможно, вам следует запросить [ссылку] элемента? Я полагаю, что RSS не создан для того, чтобы показывать вам весь пост, а только его фрагмент и дату / время. Однако обратите внимание, что если вы запросите всю ссылку на сообщение, вы будете иметь дело с (x) html и, вероятно, SimpleXML не удастся из-за недопустимого xml.   -  person Alexey    schedule 18.05.2012
Как сказал Алексей. RSS-канал, который вы разбираете, не содержит всей истории. Вам нужно будет либо использовать канал, который действительно содержит полную историю для каждой записи, либо использовать HTML Dom Parser. Быстрый поиск в Google предоставляет множество вариантов, вот один -, который я использовал в прошлом . Обратите внимание, я всегда обнаруживал, что парсинг Dom был немного медленным. Надеюсь это поможет.   -  person fl3x7    schedule 20.05.2012

Ответы (2)

Попробуйте этот код:

require_once 'simple_html_dom.php';

$a = curl_init("");
curl_setopt($a, CURLOPT_RETURNTRANSFER,1);
$b = curl_exec($a);
$xml = simplexml_load_string($b);
$items = $xml->xpath('//channel/item');

foreach ($items as $item) {
    $a = curl_init((string)$item->guid);
    curl_setopt($a, CURLOPT_RETURNTRANSFER,1);
    $body = curl_exec($a);
    $html = str_get_html($body);
    $newsContent = $html->find('div[class=bodytext]');
    $newsContent = $newsContent[0];
    print "<pre>";
    print "</pre>";

Также вам понадобится эта библиотека для кода PHP.

person rdo    schedule 06.06.2012

Вы можете попробовать Domdocument, как показано ниже, чтобы прочитать теги RSS-каналов

$xmlDoc = new DOMDocument();


person vishal shah    schedule 19.07.2012