Я недавно скачал последнюю версию nutch. (nutch-1.1) Просматривая его код, я заметил, что есть файл conf / schema.xml, который определяет схему для части solr в комплекте с nutch.
В этом файле schema.xml есть поля для каждого подключаемого модуля. У меня вопрос: как узнать, какие значения перенастраивает конкретный плагин? Другими словами, если я использую сторонний плагин (скажем, плагин X) с Nutch и хочу добавить несколько полей в schema.xml, как мне выяснить, какой «плагин X» возвращается и если это строка, int, массив?
Мой второй вопрос заключается в том, что я вижу conf / solrindex-mapping.xml, который используется solrIndexer of nutch. Это сбивает меня с толку, поскольку не все поля в schema.xml находятся в solrindex-mapping.xml.
Для простоты объяснения ответа допустим, что плагин X - это плагин подачи, связанный с Nutch.