Вопросы по теме 'dataimporthandler'

Индексирование HTML в Solr DataImportHandler
В настоящее время я использую JdbcDataSource для импорта документа из серверной части SqlServer. Некоторые поля содержат необработанный HTML-код. Я хочу удалить HTML перед индексированием. Проблема в том, что что-то кодирует открывающий символ '‹'...
1517 просмотров
schedule 07.10.2021

Как настроить планировщик DIH на Solr 5.1.0
На странице вики объясняется, как настроить планирование в старой версии Solr, но она не обновлялась для Solr 5.1.0. Проблема в том, что я не могу настроить файл dataimport.properties . Инструкции в вики: независимо от того, используете...
551 просмотров
schedule 21.09.2021

Проблема Solr DataImportHandler с географическими полями
У меня возникла проблема при попытке импортировать данные о местоположении из MySQL с помощью DataImportHandler. Запрос для одной из моих подчиненных сущностей: SELECT [...] AS data, AsText(data_geo) AS data_geo FROM [table] WHERE [conditions]...
128 просмотров
schedule 20.10.2021

Solr DIH замедляется при импорте XML-данных из базы данных Oracle
Я работаю над задачей Solr DIH (DataImportHandler) для импорта примерно 20 миллионов документов, хранящихся в базе данных Oracle. Первоначально этот импорт будет увеличиваться до более чем 500 документов в секунду, но в течение первых 150 000...
165 просмотров
schedule 18.09.2021

очистка удаленных документов из индекса solr
Я использую solr на своем веб-сайте, но у меня есть небольшая проблема. Индексация работает отлично. Я удалил несколько документов из своей базы данных (у меня было 50 документов, теперь у меня 41). Запускаю dataimport, solr говорит, что...
1510 просмотров
schedule 03.03.2022

Solr6 не может добавить ядро, показывает следующую ошибку
Я использую solr 6.3.0 на машине RedHat, интегрированной с сервером Tomcat. Одно из моих ядер не добавляется. Ядро импортирует данные из базы данных SQL Server. Файлы solr.log печатают следующее сообщение. Может кто-нибудь помочь найти меня,...
732 просмотров

Подключение solr к aws RDS Mysql через обработчик импорта данных
Недавно я начал внедрять solr-cloud на AWS EC2 для поисковых приложений. Я создал 2 экземпляра AWS Ec2 со следующими конфигурациями --- Тип EC2 - t2.medium оперативная память - 4 ГБ Место на диске - 8 ГБ ОС - ubuntu 18.04 Для двух...
288 просмотров

Solr 4.1 DataImportHandler ClassNotFoundException
Я пытался настроить обработчик импорта данных (Solr 4.1), следуя этому руководству и пробовал решения, предложенные в предыдущих сообщениях, таких как Настройка DIH в многоядерном solr , и добавил банку импорта данных в путь к классам. но ошибка...
26020 просмотров
schedule 23.04.2022

Solr 5.0 Tika TikaEntityProcessor индексирует один документ
У меня есть ряд документов, хранящихся в папке, которую я использую tika для периодического импорта их в Solr. Файл data-import.xml: <dataSource name="tika" type="BinFileDataSource" /> <document> <entity...
1361 просмотров
schedule 13.05.2022

Импорт данных Apache Solr в Datastax Solr — DateFormat Transformer DIH
Я пытаюсь импортировать данные из Apache Solr в Datastax Solr, используя DIH. Я могу получить документ, но когда DIh пытается создать документ, я получаю следующую ошибку в полях даты: org.apache.solr.common.SolrException: Invalid Date...
460 просмотров
schedule 17.06.2022

Импорт данных Solr с вложенными документами
С версии 4.5 SOLR поддерживает вложенные документы, но есть ли для этого DIH? Мне нужно импортировать родительские и дочерние документы из MySQL, но я не могу найти никакого решения. UPD thinkisdifficult_hashtag. Решение моей проблемы — простое...
336 просмотров
schedule 27.06.2022

jndi websphere обработчик импорта данных solr
Я пытаюсь использовать атрибут jndiName в db-data-config.xml. Это отлично работает в Tomcat. Однако возникли проблемы в веб-сфере. Выдается следующее исключение "Убедитесь, что приложение J2EE не выполняет операции JNDI с именами" java: "в...
1248 просмотров
schedule 03.08.2022

Solr + DIH + Tika: индексация огромного количества файлов, как обрабатывать удаленные файлы?
У меня есть огромное количество PDF/Word/Excel/и т.д. файлы для индексации (40 ГБ сейчас, но, возможно, до 1000 ГБ в некоторые месяцы), и я рассматривал возможность использования Solr с DataImportHandler и Tika. Я прочитал много тем на эту тему, но...
920 просмотров

Безопасный импорт данных Solr и замена ядра на веб-сайте с высокой посещаемостью
Здравствуйте, коллеги-технари. Предположим, у нас есть веб-сайт (PHP) с миллионами посетителей в месяц, и мы запускаем индекс SolR на веб-сайте с 4 миллионами размещенных документов. Solr работает на 4 отдельных серверах, где один сервер является...
3490 просмотров

Как избежать одинарных кавычек в переменных в Solr DataImportHandler?
У меня есть DataImportHandler для импорта данных из базы данных SQL. Корневой объект Foo имеет много Bar . Таблица Bar использует Foo.Name в качестве внешнего ключа. Некоторые имена Foo заключены в одинарные кавычки, например STW's ....
1379 просмотров
schedule 25.09.2022

Solr dataimporthandler, не может использовать временные метки объекта
Я использую обработчик импорта данных solr для ввода данных из нескольких источников, используя несколько объектов. Когда я запускаю импорт, файл dataimport.properties имеет несколько временных меток для каждого отдельного объекта. Я хочу...
245 просмотров
schedule 30.09.2022

проблема дельта-импорта в solr DIH
Когда я запускаю команду full_import, она работает нормально. Обновленные даты записываются в файл dataimport.properties. Когда я запускаю дельта-импорт, он дает ошибку индексации. Откатил все изменения. Файл dataimport.properties уже создан и...
5097 просмотров
schedule 06.12.2022

DataImportHandlerException: невозможно выполнить запрос
Я пытался найти свою конкретную проблему, но не нашел решения. Я также прочитал вики на DIH и, похоже, все настроил правильно, но мой запрос все еще не работает. спасибо за помощь Я использую Solr 3.1 с Tomcat 6.0 Windows Server 2003 r2 и SQL...
6020 просмотров
schedule 01.05.2023

Обработка гибридной базы данных MySQL и XML в индекс Solr
Проблема: Таблица в MySQL с несколькими обычными полями и одним текстовым полем, содержащим XML. Мне нужно использовать обработчик импорта данных Solr для обработки этой таблицы в индекс Solr. Однако поле XML необходимо разбить на несколько...
196 просмотров

Не удалось создать экземпляр прослушивателя org.apache.solr.handler.dataimport.scheduler.ApplicationListener
Я пытаюсь настроить dataimportscheduler для своего индекса, когда добавляю: <listener> <listener-class> org.apache.solr.handler.dataimport.scheduler.ApplicationListener </listener-class> </listener> в...
1620 просмотров
schedule 12.11.2022