simplehtmldom - переходите по ссылкам

Может ли кто-нибудь показать пример, как переходить по ссылкам для каждого элемента <a href> во время парсинга и получать соответствующую информацию?

$html = file_get_html('http://www.blabla.com/');
$html->find('div', 1)->class = 'bar';

Теперь у каждого <li> есть ссылка на дополнительную информацию

<li class="#Selected">
<a href="/contactinfo/ITService/">info</a>
<h2>New York</h2>
<h3>USA</h3>
<strong>ITService</strong>
</li>

Потом :

<div class="InfoD">
<h2>New York</h2>
<h3>USA</h3>
<strong>ITService</strong>
<p>
Tel. : XXXXXX   
</p>
<p>
Mail. : [email protected]    
</p>
</div>

Я знаю, как очищать такие элементы с помощью HTML DOM, но когда есть ссылки для каждого элемента и нескольких страниц, я не уверен, как это сделать ... Если кто-нибудь может указать на пример или любой аналогичный учебник. Спасибо


person Awena    schedule 26.11.2013    source источник


Ответы (1)


Сначала вы получаете все ссылки из li.#Selected a, затем вы делаете цикл, чтобы получить div.InfoD из каждой ...

Вот фрагмент кода, показывающий, как:

// includes Simple HTML DOM Parser
include "simple_html_dom.php";

$url = "http://www.blabla.com/";

$baseUrl= "http://www.blabla.com"

//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a URL
$html->load_file($url);

// Get all links
$anchors = $html->find('li.#Selected a');

// loop through each link and get the node having "InfoD" class
// Everytime make sure to clear dom objects to avoid memory leaks
foreach ($anchors as $anchor) {

    // Create the new link to parse
    $urlTemp = $baseUrl . $anchor->href;

    //Create a DOM object
    $html2 = new simple_html_dom();
    // Load HTML from a URL
    $html2->load_file($urlTemp);

    // Get all nodes with "text-logo"
    $div = $html->find('div.InfoD', 0);

    echo $div;
    echo "<hr/>";

    // Clear dom object
    $html2->clear(); 
    unset($htm2);

}

// Clear dom object
$html->clear(); 
unset($html);
person Enissay    schedule 26.11.2013
comment
как лучше всего просто автоматически переходить по ссылкам и очищать полный контент со страниц с подробными сведениями? - person Natalia; 15.02.2014