Вопросы по теме 'nokogiri'

Как выполнить в Nokogiri поиск по регулярному выражению для текста, соответствующего определенному началу?
Данный: require 'rubygems' require 'nokogiri' value = Nokogiri::HTML.parse(<<-HTML_END) "<html> <body> <p id='para-1'>A</p> <div class='block' id='X1'> <h1>Foo</h1> <p...
14274 просмотров
schedule 06.10.2021

nokogiri: как обернуть теги HTML вокруг заданных элементов xpath?
У меня есть xpath для захвата каждого текстового узла, который не окружен какими-либо тегами html. Вместо этого они разделяются через <br> . Я хотел бы обернуть их <span> тегами....
1667 просмотров
schedule 06.11.2021

Nokogiri анализирует контент, загруженный с помощью ajax
Может ли nokogiri анализировать контент, загруженный через ajax? Если нет, как бы я это сделал?
2648 просмотров
schedule 10.10.2021

Проблема с получением значения атрибута узла XML с помощью nokogiri
Я пытаюсь разобрать XML-файл из iTunes с помощью nokogiri и rails 3. Вот мой код: itunes_top_300 = Nokogiri.HTML(open("http://itunes.apple.com/us/rss/toppodcasts/limit=300/xml")) itunes_top_300.search('//entry').each do |podcast| url =...
2296 просмотров
schedule 21.09.2021

OS X 10.6 Установка Nokogiri
Я новичок в OS X и ничего не знаю о компиляции, MacPorts, Homebrew и т. Д. Все, что я хочу сделать, это установить гем Nokogiri на OS X. В Windows это было так просто: gem install nokogiri Однако, когда я пробую это в OS X, я получаю...
699 просмотров
schedule 13.09.2021

Как разобрать простую HTML-таблицу с помощью Nokogiri?
Я хочу проанализировать HTML-страницу с помощью Nokogiri. В части страницы есть таблица, в которой не используется какой-либо конкретный идентификатор. Можно ли извлечь что-то вроде: Today,3,455,34 Today,1,1300,3664 Today,10,100000,3444,...
3003 просмотров
schedule 05.09.2021

ruby поиск имени и значения в объекте nokogiri
Приведенный ниже код предоставит мне все узлы с name = visible, например этот узел: <property name="visible" value="false"/> vis = @noko_obj.search("property[name=visible]") ... независимо от того, какое значение. Однако что,...
458 просмотров
schedule 01.10.2021

Как с помощью Nokogiri создать схему структуры HTML-тегов на странице?
Я пытаюсь создать схему структуры тегов HTML-страницы с помощью Nokogiri, которую я могу использовать в качестве индикатора, изменилось ли содержимое HTML-страницы. Для этого в основном я хочу удалить весь текст и оставить только HTML-теги (без...
253 просмотров
schedule 10.11.2021

Извлеките JSON с помощью Nokogiri
require 'open-uri' require 'json' require 'nokogiri' doc = Nokogiri::HTML(open("http://www.highcharts.com/demo/")) puts doc Но я хочу иметь возможность извлекать json с этой веб-страницы, использование регулярных выражений, похоже, не...
9942 просмотров
schedule 25.10.2021

Определение дочернего индекса элемента Nokogiri
если у меня есть Nokogiri :: XML :: Element, как мне определить его дочерний индекс по отношению к его родительскому элементу? То есть: <foo> <-- parent <bar/> <-- 1st child <bar/> <-- 2nd child </foo>...
2264 просмотров
schedule 12.10.2021

Получите значения атрибутов с пространством имен, используя Nokogiri
Я разбираю файл document.xml с помощью Nokogiri, извлеченный из файла .docx, и мне нужно получить значения атрибутов с именами, например " w:val ". Это образец исходного XML: <w:document> <w:body> <w:p w:rsidR="004D5F21"...
1784 просмотров
schedule 17.11.2021

Нокогири: Как исключить атрибуты HTML с определенными именами классов?
Если я хочу проанализировать блок HTML с помощью Nokogiri в Ruby, например: <th class="first">ancd</th> <th>xyz</th> <th>sdf</th> Как мне исключить тег, содержащий определенное имя класса? «первый» в...
1980 просмотров
schedule 08.10.2021

Как мне что-то очистить после того, как JS изменил DOM?
Я использую Mechanize, хотя открыт для Nokogiri, если Mechanize не сможет этого сделать. Я бы хотел очистить страницу после загрузки всех скриптов, а не заранее. Как я могу это сделать?
1790 просмотров

Капибара не может найти средство выбора даты
Используя капибару, я пытаюсь указать дату. В форме есть средство выбора даты javascript. Я пробовал следующие способы выбрать его: find('input[type=date]').focus() find(:xpath, ".//*[@id='Sdate']") fill_in('Sdate', :with => '25/07/2555')...
1623 просмотров
schedule 13.10.2021

Скрипт Ruby webscrape для GoDaddy
Я новичок в Ruby, и для моего первого задания по написанию сценариев меня попросили написать сценарий очистки веб-страниц, чтобы получить элементы наших списков DNS из GoDaddy. Возникли проблемы с очисткой ссылок, и мне нужно перейти по ссылкам....
607 просмотров

Не могу понять, как анализировать строку таблицы и определенные столбцы и экспортировать в CSV
Во-первых, позвольте мне признать, что я новичок в Ruby. Я использовал его всего несколько дней, но с умеренным успехом. Мне удалось проанализировать определенные элементы, которые существуют по отдельности в нескольких файлах HTML, и экспортировать...
215 просмотров
schedule 17.10.2021

Rails Парсинг большого XML с помощью Nokogiri :: XML :: Reader = ›Model.create
У меня много больших (32 Мб) XML-файлов с информацией о товарах из разных магазинов. Я использую Rails, размещенный на Heroku. Я хочу проанализировать эти XML-каналы и записать эти продукты в свою базу данных. У меня есть полу-рабочее решение, но...
1531 просмотров
schedule 14.10.2021

Разбор XML с настраиваемой структурой с использованием Nokogiri и Ruby
Возможное дублирование: запрос пространства имен Nokogiri / Xpath У меня есть такой XML-файл: <?xml version="1.0" encoding="UTF-8"?> <Structure xmlns="http://www.SDMX.org/resources/SDMXML/schemas/v2_0/message"...
256 просмотров
schedule 10.11.2021

Установка nokogiri - не удалось создать собственное расширение gem
При установке Nokogiri на Ubuntu 12 у меня возникла ошибка: Installing nokogiri (1.4.4) with native extensions Gem::Installer::ExtensionBuildError: ERROR: Failed to build gem native extension. /usr/bin/ruby1.9.1 extconf.rb...
3864 просмотров
schedule 13.11.2021

получить текст узла () с тегом привязки или без него
Я не могу понять, как получить текст ячейки таблицы () независимо от того, является ли тег привязки родительским по отношению к тексту. С УЧАСТИЕМ: <td class="c divComms" title="Komentarz|"> <a...
147 просмотров
schedule 05.09.2021