Вопросы по теме 'nokogiri'
Как выполнить в Nokogiri поиск по регулярному выражению для текста, соответствующего определенному началу?
Данный:
require 'rubygems'
require 'nokogiri'
value = Nokogiri::HTML.parse(<<-HTML_END)
"<html>
<body>
<p id='para-1'>A</p>
<div class='block' id='X1'>
<h1>Foo</h1>
<p...
14274 просмотров
schedule
06.10.2021
nokogiri: как обернуть теги HTML вокруг заданных элементов xpath?
У меня есть xpath для захвата каждого текстового узла, который не окружен какими-либо тегами html. Вместо этого они разделяются через <br> . Я хотел бы обернуть их <span> тегами....
1667 просмотров
schedule
06.11.2021
Nokogiri анализирует контент, загруженный с помощью ajax
Может ли nokogiri анализировать контент, загруженный через ajax? Если нет, как бы я это сделал?
2648 просмотров
schedule
10.10.2021
Проблема с получением значения атрибута узла XML с помощью nokogiri
Я пытаюсь разобрать XML-файл из iTunes с помощью nokogiri и rails 3.
Вот мой код:
itunes_top_300 = Nokogiri.HTML(open("http://itunes.apple.com/us/rss/toppodcasts/limit=300/xml"))
itunes_top_300.search('//entry').each do |podcast|
url =...
2296 просмотров
schedule
21.09.2021
OS X 10.6 Установка Nokogiri
Я новичок в OS X и ничего не знаю о компиляции, MacPorts, Homebrew и т. Д. Все, что я хочу сделать, это установить гем Nokogiri на OS X.
В Windows это было так просто:
gem install nokogiri
Однако, когда я пробую это в OS X, я получаю...
699 просмотров
schedule
13.09.2021
Как разобрать простую HTML-таблицу с помощью Nokogiri?
Я хочу проанализировать HTML-страницу с помощью Nokogiri. В части страницы есть таблица, в которой не используется какой-либо конкретный идентификатор. Можно ли извлечь что-то вроде:
Today,3,455,34
Today,1,1300,3664
Today,10,100000,3444,...
3003 просмотров
schedule
05.09.2021
ruby поиск имени и значения в объекте nokogiri
Приведенный ниже код предоставит мне все узлы с name = visible, например этот узел:
<property name="visible" value="false"/>
vis = @noko_obj.search("property[name=visible]")
... независимо от того, какое значение. Однако что,...
458 просмотров
schedule
01.10.2021
Как с помощью Nokogiri создать схему структуры HTML-тегов на странице?
Я пытаюсь создать схему структуры тегов HTML-страницы с помощью Nokogiri, которую я могу использовать в качестве индикатора, изменилось ли содержимое HTML-страницы.
Для этого в основном я хочу удалить весь текст и оставить только HTML-теги (без...
253 просмотров
schedule
10.11.2021
Извлеките JSON с помощью Nokogiri
require 'open-uri'
require 'json'
require 'nokogiri'
doc = Nokogiri::HTML(open("http://www.highcharts.com/demo/"))
puts doc
Но я хочу иметь возможность извлекать json с этой веб-страницы, использование регулярных выражений, похоже, не...
9942 просмотров
schedule
25.10.2021
Определение дочернего индекса элемента Nokogiri
если у меня есть Nokogiri :: XML :: Element, как мне определить его дочерний индекс по отношению к его родительскому элементу? То есть:
<foo> <-- parent
<bar/> <-- 1st child
<bar/> <-- 2nd child
</foo>...
2264 просмотров
schedule
12.10.2021
Получите значения атрибутов с пространством имен, используя Nokogiri
Я разбираю файл document.xml с помощью Nokogiri, извлеченный из файла .docx, и мне нужно получить значения атрибутов с именами, например " w:val ".
Это образец исходного XML:
<w:document>
<w:body>
<w:p w:rsidR="004D5F21"...
1784 просмотров
schedule
17.11.2021
Нокогири: Как исключить атрибуты HTML с определенными именами классов?
Если я хочу проанализировать блок HTML с помощью Nokogiri в Ruby, например:
<th class="first">ancd</th>
<th>xyz</th>
<th>sdf</th>
Как мне исключить тег, содержащий определенное имя класса? «первый» в...
1980 просмотров
schedule
08.10.2021
Как мне что-то очистить после того, как JS изменил DOM?
Я использую Mechanize, хотя открыт для Nokogiri, если Mechanize не сможет этого сделать.
Я бы хотел очистить страницу после загрузки всех скриптов, а не заранее.
Как я могу это сделать?
1790 просмотров
schedule
17.09.2021
Капибара не может найти средство выбора даты
Используя капибару, я пытаюсь указать дату. В форме есть средство выбора даты javascript. Я пробовал следующие способы выбрать его:
find('input[type=date]').focus()
find(:xpath, ".//*[@id='Sdate']")
fill_in('Sdate', :with => '25/07/2555')...
1623 просмотров
schedule
13.10.2021
Скрипт Ruby webscrape для GoDaddy
Я новичок в Ruby, и для моего первого задания по написанию сценариев меня попросили написать сценарий очистки веб-страниц, чтобы получить элементы наших списков DNS из GoDaddy.
Возникли проблемы с очисткой ссылок, и мне нужно перейти по ссылкам....
607 просмотров
schedule
20.11.2021
Не могу понять, как анализировать строку таблицы и определенные столбцы и экспортировать в CSV
Во-первых, позвольте мне признать, что я новичок в Ruby. Я использовал его всего несколько дней, но с умеренным успехом. Мне удалось проанализировать определенные элементы, которые существуют по отдельности в нескольких файлах HTML, и экспортировать...
215 просмотров
schedule
17.10.2021
Rails Парсинг большого XML с помощью Nokogiri :: XML :: Reader = ›Model.create
У меня много больших (32 Мб) XML-файлов с информацией о товарах из разных магазинов. Я использую Rails, размещенный на Heroku.
Я хочу проанализировать эти XML-каналы и записать эти продукты в свою базу данных. У меня есть полу-рабочее решение, но...
1531 просмотров
schedule
14.10.2021
Разбор XML с настраиваемой структурой с использованием Nokogiri и Ruby
Возможное дублирование: запрос пространства имен Nokogiri / Xpath
У меня есть такой XML-файл:
<?xml version="1.0" encoding="UTF-8"?>
<Structure xmlns="http://www.SDMX.org/resources/SDMXML/schemas/v2_0/message"...
256 просмотров
schedule
10.11.2021
Установка nokogiri - не удалось создать собственное расширение gem
При установке Nokogiri на Ubuntu 12 у меня возникла ошибка:
Installing nokogiri (1.4.4) with native extensions
Gem::Installer::ExtensionBuildError: ERROR: Failed to build gem native extension.
/usr/bin/ruby1.9.1 extconf.rb...
3864 просмотров
schedule
13.11.2021
получить текст узла () с тегом привязки или без него
Я не могу понять, как получить текст ячейки таблицы () независимо от того, является ли тег привязки родительским по отношению к тексту.
С УЧАСТИЕМ:
<td class="c divComms" title="Komentarz|">
<a...
147 просмотров
schedule
05.09.2021