Вопросы по теме 'dih'

Как настроить планировщик DIH на Solr 5.1.0
На странице вики объясняется, как настроить планирование в старой версии Solr, но она не обновлялась для Solr 5.1.0. Проблема в том, что я не могу настроить файл dataimport.properties . Инструкции в вики: независимо от того, используете...
551 просмотров
schedule 21.09.2021

Solr DIH замедляется при импорте XML-данных из базы данных Oracle
Я работаю над задачей Solr DIH (DataImportHandler) для импорта примерно 20 миллионов документов, хранящихся в базе данных Oracle. Первоначально этот импорт будет увеличиваться до более чем 500 документов в секунду, но в течение первых 150 000...
165 просмотров
schedule 18.09.2021

Solr DataImportHandler, Несколько документов
Я новичок в Solr ... Мне нужно импортировать данные из БД с разными контекстами ( schemas ). и я хочу иметь возможность искать оба этих документа с помощью одного запроса. Почитал, немного запутался... так как я понимаю, что...
408 просмотров
schedule 08.06.2022

Импорт данных Apache Solr в Datastax Solr — DateFormat Transformer DIH
Я пытаюсь импортировать данные из Apache Solr в Datastax Solr, используя DIH. Я могу получить документ, но когда DIh пытается создать документ, я получаю следующую ошибку в полях даты: org.apache.solr.common.SolrException: Invalid Date...
460 просмотров
schedule 17.06.2022

Solr + DIH + Tika: индексация огромного количества файлов, как обрабатывать удаленные файлы?
У меня есть огромное количество PDF/Word/Excel/и т.д. файлы для индексации (40 ГБ сейчас, но, возможно, до 1000 ГБ в некоторые месяцы), и я рассматривал возможность использования Solr с DataImportHandler и Tika. Я прочитал много тем на эту тему, но...
920 просмотров

Увеличение времени индекса Solr
Я импортирую данные с помощью DIH в solr. В моем файле schema.xml определены все поля. Я знаю, что есть два типа методов повышения: время запроса или время индексации. Можно ли увеличить поля, присвоив им вес во время индексации. Например, если...
724 просмотров
schedule 26.08.2022

Смещение времени последнего индекса Solr dih
Solr last_index_time — это машинное время сервера Solr, когда запускается dih. Если система распределена с несколькими серверами, у которых нет точной отметки времени, как справиться с разницей во времени? Одно из решений для меня - установить...
1117 просмотров
schedule 02.10.2022

Дельта-импорт Solr DIH с составными первичными ключами?
Мой источник данных Solr — это база данных SQL, в которой первичный ключ является составным (т. е. это два поля). Это нормально для моего основного DIH query , я просто объединяю поля, и это становится моим первичным ключом Solr. Однако из...
3426 просмотров
schedule 08.05.2023

Как преобразовать pubDate из RSS-канала при импорте с использованием DIH в Solr?
Я использую RSS DIH в solr для индексации различных RSS-каналов. Проблема, с которой я сталкиваюсь, заключается в поле даты. Возврат pubDate в RSS не в том формате, который ожидает Solr, и поэтому я получаю исключение, когда запускаю Solr с этим...
447 просмотров
schedule 21.05.2023

Solr 4.5 с Tomcat 8 DataImportHandler с MSSQL 2008 R2
Я пробовал все другие вопросы и некоторые учебники в Интернете. Все заканчивается одной и той же ошибкой. Исключение «Класс не найден». Я установил solr в C:\solr , домашний каталог — C:\solr_home , а установка Tomcat — в C:\Tomcat . Я...
1448 просмотров
schedule 08.11.2022

Необъявленная общая ошибка объекта при выполнении полного импорта XML в Solr с использованием DIH
Я пытаюсь массово импортировать xml-файлы из папки в solr. Моя конфигурация DIH выглядит так. <dataConfig> <dataSource type="FileDataSource"/> <document> <!-- this outer processor generates a list of files satisfying...
1365 просмотров

DateFormatTransformer не работает с FileListEntityProcessor в обработчике импорта данных
При индексировании данных из локальной папки в моей системе я использую приведенную ниже конфигурацию. Однако атрибут lastmodified индексируется в формате «Среда, 23 мая, 09:48:08 UTC», что не является стандартным форматом, используемым solr для...
272 просмотров
schedule 10.01.2023

SOLR — DataImportHandler — как сопоставить несколько объектов внутри одного списка объектов json
Я новичок в SOLR, я пытаюсь индексировать результаты запросов к БД оракула с помощью SOLR. Я написал config.xml и добавил индексы в schema.xml. У меня есть несколько запросов в качестве подсущностей (с дочерним элементом = true) в моем файле...
258 просмотров
schedule 01.02.2023

Как разделить значения многозначного поля на динамические поля
У меня есть 1 многозначное поле типа даты, его определение в schema.xml показано ниже: <field name="fecha_referencia" type="pdates" uninvertible="true" indexed="true" stored="true"/> Всего...
25 просмотров
schedule 18.02.2023

Ответ на запрос фасета Solr 6.2.0, возвращающий вылитые результаты
Я создал новый основной и индексированный каталог из базы данных оракула, используя DIH. Индексация прошла успешно. Итак, теперь я пытаюсь запросить это, используя фасетный запрос, следующим образом. Это моя структура данных была...
69 просмотров
schedule 25.11.2023

как импортировать метаданные и контент alfresco в solr 6
Я новичок в solr и alfresco , и мне нужно создать индекс solr 6 , импортирующий метаданные и контент из alfresco. Вы можете сказать, что у alfresco уже есть массив solr 4 со своим индексом, но я не могу его трогать, и на данный момент в нем...
213 просмотров
schedule 20.12.2023