У меня есть целая куча больших HTML-документов с таблицами данных внутри, и я хочу написать скрипт, который может обрабатывать HTML-файл, изолировать теги и их содержимое, а затем объединять все строки в этих таблицах в одну большую таблицу данных. . Затем выполните цикл по строкам и столбцам новой большой таблицы.
После некоторых исследований я начал пробовать класс PHP DOMDocument для анализа HTML, но я просто хотел знать, это лучший способ сделать что-то подобное?
Это то, что у меня есть до сих пор ...
$dom = new DOMDocument();
$dom->preserveWhiteSpace = FALSE;
@$dom->loadHTMLFile('exrate.html');
$tables = $dom->getElementsByTagName('table');
Как вырезать все, кроме таблиц и их содержимого? Тогда я действительно хотел бы удалить первую таблицу, так как это оглавление. Затем переберите все строки таблицы и соберите их в одну большую таблицу.
У кого-нибудь есть подсказки, как это сделать? Я копался в документах для DOMDocument на php.net, но нахожу синтаксис довольно сбивающим с толку!
Привет, Б
РЕДАКТИРОВАТЬ: Вот пример файла HTML с таблицами данных, к которым я хотел бы присоединиться http://thenetzone.co.uk/exrates/exrate.html