как импортировать метаданные и контент alfresco в solr 6

Я новичок в solr и alfresco, и мне нужно создать индекс solr 6, импортирующий метаданные и контент из alfresco. Вы можете сказать, что у alfresco уже есть массив solr 4 со своим индексом, но я не могу его трогать, и на данный момент в нем нет полей, кроме id и версии, так что это бесполезно.

Мне удалось создать документы в индексе, импортировав их из oracle db, которые я буду использовать для интеграции объектов, импортированных в конечном итоге из alfresco.

Пытался использовать alfresco API, который возвращает json в качестве ответа, но, даже если в документации DIH между целями говорится, что «Сделать возможным подключение любого источника данных (ftp,scp etc) и любого другого формата по выбору пользователя (JSON,csv etc)», я ничего не нашел об этом

Кто-нибудь уже сталкивался с этой проблемой и как решил ее? Надеюсь на ваши предложения и, возможно, разные подходы.


person herbie    schedule 17.05.2016    source источник
comment
Ваша проблема заключается в том, как получить документы уже в Alfresco, чтобы вы могли индексировать их в своем собственном SOLR — в дополнение к тому, который уже доступен с установкой Alfresco — я вас понимаю?   -  person Lista    schedule 18.05.2016
comment
вот так. Чего я действительно не понимаю, так это того, как пакет solr создает индекс на основе документа alfresco... В конце концов я хотел бы воспроизвести этот механизм. На данный момент я думаю о расширении URLDataSource или создании нового процессора для обработки json. Спасибо   -  person herbie    schedule 18.05.2016
comment
В дополнение к приведенному ниже ответу Джеффа Потса вы можете использовать тот же принцип, который Alfresco использует в настоящее время, и периодически вносить изменения в SOLR. Хорошая отправная точка: alfresco.blog.redpill-linpro.com/2015/04/30/   -  person Lista    schedule 19.05.2016


Ответы (1)


Похоже, вы хотите по существу отправить информацию из Alfresco в свою собственную установку Solr 6. Вы не хотите трогать встроенный сервер Solr, который поставляется с Alfresco, потому что вы, вероятно, сломаете что-то критичное для правильной работы Alfresco.

Вы можете взглянуть на этот проект: https://manifoldcf.apache.org. Его можно использовать для перекачки данных из Alfresco в Solr.

person Jeff Potts    schedule 18.05.2016
comment
Я уже знал коллекторcf, но с трудом настраивал его. Так что я бы предпочел избежать этого. На данный момент я создаю собственный источник данных и JsonProcessor для импорта данных. Я опубликую их, если мне удастся заставить их работать. - person herbie; 19.05.2016
comment
На данный момент я создал банку с моим новым источником данных, и я изо всех сил пытаюсь понять, куда его поместить, чтобы его нашел загрузчик классов jetty/solr. Любые подсказки? Единственным способом на данный момент было поместить один класс в dataimporthandler.jar, но при первом вызове зависимости он терпит неудачу. - person herbie; 19.05.2016
comment
Здравствуйте, по некоторым причинам stackoverflow решил, что я не могу опубликовать какой-либо ответ. Мне удалось создать customDataSource, который вызывает службу отдыха, получает ответ в json, преобразует в xml, а затем, настроив сопоставление через xpathProcessor, должно работать. - person herbie; 20.05.2016