Nutch 1.1 schema.xml

Я недавно скачал последнюю версию nutch. (nutch-1.1) Просматривая его код, я заметил, что есть файл conf / schema.xml, который определяет схему для части solr в комплекте с nutch.

В этом файле schema.xml есть поля для каждого подключаемого модуля. У меня вопрос: как узнать, какие значения перенастраивает конкретный плагин? Другими словами, если я использую сторонний плагин (скажем, плагин X) с Nutch и хочу добавить несколько полей в schema.xml, как мне выяснить, какой «плагин X» возвращается и если это строка, int, массив?

Мой второй вопрос заключается в том, что я вижу conf / solrindex-mapping.xml, который используется solrIndexer of nutch. Это сбивает меня с толку, поскольку не все поля в schema.xml находятся в solrindex-mapping.xml.

Для простоты объяснения ответа допустим, что плагин X - это плагин подачи, связанный с Nutch.


person milan pandya    schedule 15.07.2010    source источник


Ответы (1)


  1. Получите доступ к соответствующему индексу Nutch и проверьте его Просмотреть рецепт с практическими рекомендациями
person NSRTechRecipes    schedule 28.11.2010