Вопросы по теме 'xml2'

XML - анализ выборочных узлов в R (xml2)
У меня есть входной XML-файл. В файле есть данные о некоторых транзакциях. XML-файл выглядит так: <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <Message xmlns:bs="urn:iso:std:iso:20022:tech:xsd:camt.053.001.02"...
2723 просмотров
schedule 10.10.2021

Разбор большого и сложного XML-файла в data.frame
Итак, у меня есть большой XML-файл с множеством отчетов. Я создал пример данных ниже, чтобы приблизительно показать размер xml и его структуру: x <- "<Report><Agreements><AgreementList...
3036 просмотров
schedule 23.10.2021

XML с различным количеством дочерних элементов в фрейме / таблице данных
Я пытаюсь преобразовать данные из XML в табличную форму. Я борюсь с элементами с дочерями. Вот пример: library(xml2) library(data.table) doc = "<doc> <rec> <name> John </name> <address>...
80 просмотров
schedule 11.10.2021

Как сохранить перенос строки при получении текста с помощью rvest
Я извлекаю текст судебных решений с веб-сайта и хочу сохранить разрывы строк (которые мне понадобятся позже для анализа текста). К сожалению, rvest's html_text удаляет разрывы строк и, например, два слова, изначально разделенные \ n, просто...
168 просмотров
schedule 23.11.2021

как перебрать zillow / риэлтор, используя rvest, чтобы тянуть ссылки
В настоящее время я использую Rvest, чтобы попытаться извлечь все ссылки со следующего URL-адреса: https://www.zillow.com/browse/homes/fl/miami-dade-county/ Приведенный ниже код удовлетворяет тому, что я хочу сделать для одного URL-адреса. #dl...
60 просмотров
schedule 09.11.2021

В R сайт, читаемый с помощью read_html, перенаправляется. Как получить URL-адрес, на который он был перенаправлен?
this_page = read_html("https://apu.edu/athletics") > this_page {xml_document} <html id="ctl00_html" lang="en" class=" index homepage"> [1] <head>\n<meta http-equiv="Content-Type"...
61 просмотров
schedule 15.10.2021

Скопируйте данные в R
В настоящее время я пытаюсь очистить стандартную статистику игрока table в R, но мне не удается найти нужную таблицу. html_link <- "https://fbref.com/en/comps/9/stats/Premier-League-Stats#stats_standard::1"...
55 просмотров
schedule 15.10.2021

генерировать вызовы функций для изменения xml с помощью R
Я хотел бы динамически изменять XML-документ с помощью R и xml2: мой подход заключался бы в том, чтобы параметры были готовы в фрейм данных, и просто передать эти параметры функции, которая изменила бы XML-документ. library(xml2) doc <-...
60 просмотров
schedule 15.03.2022

R xml2 извлечь элемент из файла xbrl
Может ли кто-нибудь помочь мне понять, почему я не могу извлечь узел / элемент из этого xml файла? Технически это файл xbrl, но я ожидаю, что библиотека R xml2 будет работать точно так же. Прочтите в файле. Третий элемент или узел кажется...
203 просмотров
schedule 09.05.2022

XML2-Package: как обрабатывать пустые узлы?
Я пытаюсь извлечь некоторые данные с HTML-сайта. У меня есть 500 узлов, которые должны содержать дату, заголовок и резюме. Используя url <- "https://www.bild.de/suche.bild.html?type=article&query=Migration&resultsPerPage=1000"...
146 просмотров
schedule 17.05.2022

Узлы XML в фрейм данных R со всеми атрибутами узлов более высокого уровня в качестве столбцов
У меня есть XML-файл следующего формата: <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <fishmeter> <mission cruise="2019114" station="344"...
126 просмотров
schedule 02.06.2022

анализировать результаты поиска Google Scholar, очищенные с помощью rvest
Я пытаюсь использовать rvest для очистки одной страницы результатов поиска Google Scholar в фреймворке данных об авторе, названии статьи, году и названии журнала. Упрощенный воспроизводимый пример ниже - это код, который ищет в Google Scholar...
379 просмотров
schedule 10.07.2022

Как найти xpath, связанный с заданным именем атрибута в пакете xml2 R
Я использую пакет R xml2 для управления файлом xml. Я знаю имя атрибута и хочу найти к нему xpath. Я знаю, что могу найти в XML-документе заданное имя узла и вернуть связанный xpath. Например, в приведенном ниже коде я ищу имя узла CHILD_NODE и...
15 просмотров
schedule 01.08.2022

Ошибка xpath_search после попытки очистить веб-сайт с помощью xml_find_all
Я новичок в R. Я пытаюсь очистить общедоступный веб-сайт , содержащий количество заключенных и вакансий в тюрьмах в штате Сан-Паулу в Бразилии. Я журналист, и я попросил у государства эти данные, но они не захотели мне их предоставить. Я не могу...
76 просмотров
schedule 10.08.2022

Веб-скрейпинг с петлей
Я пытаюсь очистить некоторый текст с веб-сайта, используя функцию цикла, но моя функция цикла не переходит к выбору следующего элемента в моем векторном списке. Рад любым полезным советам. Спасибо library(rvest) library(xml2) ID <- c(1:2)...
95 просмотров
schedule 08.08.2022

Как получить элемент HTML с учетом более позднего содержимого другого тега, а не класса?
Я преобразовываю HTML в красивый и аккуратный CSV. У меня есть файл, полный таблиц и с несколькими классами. У меня есть три типа таблиц, и их структура одинакова. Единственная разница заключается в содержимом элемента «th», который идет после...
42 просмотров
schedule 22.09.2022

Разбор XML в R: неправильные пространства имен
У меня есть куча файлов XML и сценарий R, который считывает их содержимое во фрейм данных. Однако теперь у меня есть файлы, которые я хотел проанализировать как обычно, но в определении их пространства имен есть что-то, что не позволяет мне нормально...
1146 просмотров
schedule 12.04.2023

проблемы с чтением большого файла XML с пакетом xml2 и попыткой создания рабочего закрытия
Я использую пакет xml2 для чтения огромного XML-файла в память, и команда не выполняется со следующей ошибкой: Ошибка: символ 0x0 вне допустимого диапазона [9] Мой код выглядит следующим образом: library(xml2) doc <-...
749 просмотров
schedule 18.03.2023

R & xml2: поиск элементов по определенному текстовому значению, сохранение всех дочерних значений в data.frame
Я работаю с регулярно обновляемыми XML-отчетами, и я хотел бы автоматизировать процесс настройки с помощью R & xml2. Вот ссылка на весь пример файла. Вот образец XML: <?xml version="1.0" ?> <riDetailEnrolleeReport...
1209 просмотров
schedule 18.11.2022

как искать yahoo и получить ссылку в r
Я хочу найти что-то в Yahoo и получить ссылки: пример: поиск по sap wiki и получение вывода, например https://en.wikipedia.org/wiki/SAP_ERP в основном я следую этому вопросу: Как получить результаты поиска Google мой код :...
192 просмотров
schedule 30.11.2022