Я работаю над Java Web Scraper, который использует Jtidy / Saxon. Tidy Parsed DOM отправляется в Saxon с выражением XQuery для извлечения данных. У меня проблемы с выражением XQuery.
Веб-сайт: http://www.pacra.com.pk/reports.php. Я хочу извлечь все данные таблицы, это нужно сделать с помощью XQuery для работы со старой системой.
По сути, я хочу пройтись по всем тегам tr
в этом XPath //*[@id="mainDiv"]/div/table/tbody
вернуть тег tr
Перебрать все теги td
в каждом tr
тексте возврата в первых 6 тегах td
1, 2, 3, 4, 5, 6
Пока что я придумал
for $tr in //table/tbody
for $row in $tr/child::tbody/child::tr
return <tr><td>{data($row/td[1])}</td>
<td>{data($row/td[1])}</td>
<td>{data($row/td[2])}</td>
<td>{data($row/td[3])}</td>
<td>{data($row/td[4])}</td>
<td>{data($row/td[6])}</td>
Мой синтаксис явно неправильный. Я пытаюсь изучить XQuery, но нахождение этого веб-сайта сильно отличается от XML-примера учебного пособия. Если кто-то может помочь, мы будем очень признательны!