Чтение нескольких HTML-таблиц с веб-страницы при парсинге единых данных в UIPath

Я пытаюсь извлечь данные из указанного ниже URL-адреса, используя UIPath https://www.marketwatch.com/tools/stockresearch/globalmarkets/intindices.asp

Мое требование - сгенерировать 5 таблиц данных в UiPath для каждой из стран мира, Америки и т. Д. По приведенной выше ссылке.

Здесь я использую парсинг данных 5 раз для извлечения глобальных данных, данных Америки и т. Д. В 5 различных таблиц данных в UIPath.

Есть ли какой-нибудь самый простой способ выполнить эту задачу, например, выполнить один раз Datascraping и сгенерировать 5 таблиц данных?


person karun    schedule 25.10.2018    source источник


Ответы (2)


Пять разных таблиц данных звучат разумно, но мастер очистки приведет к большим накладным расходам при пятикратном использовании. Вам не понадобится последовательность в последовательности, и нет необходимости подключать браузер несколько раз. Я бы создал простое Open Browser действие, затем пять раз использовал мастер очистки и, наконец, переместил ExtractData действие в первую Do последовательность, например:

введите описание изображения здесь

person Wolfgang Radl    schedule 25.10.2018
comment
Спасибо @Wolfgang Radl за ваш ответ. Я пытаюсь извлечь данные, используя действие Извлечь структурированные данные, как вы сказали, но что вы даете для входного свойства Extractmetadata действия Извлечь структурированные данные. - person karun; 26.10.2018
comment
ExtractMetadata - это просто строка XML, указывающая, что именно вы хотите извлечь с данной страницы. Однако вам не нужно писать селектор и заполнять ExtractMetadata самостоятельно - просто используйте вместо этого мастер очистки данных. Однако, как я указал в ответе, его пятикратное использование создало бы много накладных расходов. Итак, вместо этого просто скопируйте все действия ExtractData и вставьте их в одну последовательность. - person Wolfgang Radl; 26.10.2018
comment
Спасибо @Wolfgang Radl. - person karun; 26.10.2018

Вы можете использовать действие поиска дочерних элементов, которое дает вам все дочерние элементы в родительском элементе. Все, что вам нужно сделать, это указать родительский элемент, под которым расположена ваша таблица. Затем используйте для каждого действия, чтобы перебрать все элементы. Измените тип аргумента на uipath.core.uielement для каждого свойства. Добавьте условие if item.get ("tag"). Equals ("TABLE"). Затем используйте вырезку данных, извлеките любую таблицу и удалите все селекторы внутри нее. На панели свойств введите элемент в поле «Элемент».

person Santhosh S    schedule 30.11.2019