Вопросы по теме 'dataimporthandler'
Индексирование HTML в Solr DataImportHandler
В настоящее время я использую JdbcDataSource для импорта документа из серверной части SqlServer. Некоторые поля содержат необработанный HTML-код. Я хочу удалить HTML перед индексированием. Проблема в том, что что-то кодирует открывающий символ '‹'...
1517 просмотров
schedule
07.10.2021
Как настроить планировщик DIH на Solr 5.1.0
На странице вики объясняется, как настроить планирование в старой версии Solr, но она не обновлялась для Solr 5.1.0. Проблема в том, что я не могу настроить файл dataimport.properties .
Инструкции в вики:
независимо от того, используете...
551 просмотров
schedule
21.09.2021
Проблема Solr DataImportHandler с географическими полями
У меня возникла проблема при попытке импортировать данные о местоположении из MySQL с помощью DataImportHandler. Запрос для одной из моих подчиненных сущностей:
SELECT [...] AS data, AsText(data_geo) AS data_geo FROM [table] WHERE [conditions]...
128 просмотров
schedule
20.10.2021
Solr DIH замедляется при импорте XML-данных из базы данных Oracle
Я работаю над задачей Solr DIH (DataImportHandler) для импорта примерно 20 миллионов документов, хранящихся в базе данных Oracle. Первоначально этот импорт будет увеличиваться до более чем 500 документов в секунду, но в течение первых 150 000...
165 просмотров
schedule
18.09.2021
очистка удаленных документов из индекса solr
Я использую solr на своем веб-сайте, но у меня есть небольшая проблема. Индексация работает отлично.
Я удалил несколько документов из своей базы данных (у меня было 50 документов, теперь у меня 41). Запускаю dataimport, solr говорит, что...
1510 просмотров
schedule
03.03.2022
Solr6 не может добавить ядро, показывает следующую ошибку
Я использую solr 6.3.0 на машине RedHat, интегрированной с сервером Tomcat. Одно из моих ядер не добавляется. Ядро импортирует данные из базы данных SQL Server. Файлы solr.log печатают следующее сообщение.
Может кто-нибудь помочь найти меня,...
732 просмотров
schedule
03.04.2022
Подключение solr к aws RDS Mysql через обработчик импорта данных
Недавно я начал внедрять solr-cloud на AWS EC2 для поисковых приложений. Я создал 2 экземпляра AWS Ec2 со следующими конфигурациями ---
Тип EC2 - t2.medium
оперативная память - 4 ГБ
Место на диске - 8 ГБ
ОС - ubuntu 18.04
Для двух...
288 просмотров
schedule
04.04.2022
Solr 4.1 DataImportHandler ClassNotFoundException
Я пытался настроить обработчик импорта данных (Solr 4.1), следуя этому руководству и пробовал решения, предложенные в предыдущих сообщениях, таких как Настройка DIH в многоядерном solr , и добавил банку импорта данных в путь к классам. но ошибка...
26020 просмотров
schedule
23.04.2022
Solr 5.0 Tika TikaEntityProcessor индексирует один документ
У меня есть ряд документов, хранящихся в папке, которую я использую tika для периодического импорта их в Solr.
Файл data-import.xml:
<dataSource name="tika" type="BinFileDataSource" />
<document>
<entity...
1361 просмотров
schedule
13.05.2022
Импорт данных Apache Solr в Datastax Solr — DateFormat Transformer DIH
Я пытаюсь импортировать данные из Apache Solr в Datastax Solr, используя DIH. Я могу получить документ, но когда DIh пытается создать документ, я получаю следующую ошибку в полях даты:
org.apache.solr.common.SolrException: Invalid Date...
460 просмотров
schedule
17.06.2022
Импорт данных Solr с вложенными документами
С версии 4.5 SOLR поддерживает вложенные документы, но есть ли для этого DIH? Мне нужно импортировать родительские и дочерние документы из MySQL, но я не могу найти никакого решения.
UPD thinkisdifficult_hashtag. Решение моей проблемы — простое...
336 просмотров
schedule
27.06.2022
jndi websphere обработчик импорта данных solr
Я пытаюсь использовать атрибут jndiName в db-data-config.xml. Это отлично работает в Tomcat. Однако возникли проблемы в веб-сфере.
Выдается следующее исключение
"Убедитесь, что приложение J2EE не выполняет операции JNDI с именами" java: "в...
1248 просмотров
schedule
03.08.2022
Solr + DIH + Tika: индексация огромного количества файлов, как обрабатывать удаленные файлы?
У меня есть огромное количество PDF/Word/Excel/и т.д. файлы для индексации (40 ГБ сейчас, но, возможно, до 1000 ГБ в некоторые месяцы), и я рассматривал возможность использования Solr с DataImportHandler и Tika. Я прочитал много тем на эту тему, но...
920 просмотров
schedule
19.08.2022
Безопасный импорт данных Solr и замена ядра на веб-сайте с высокой посещаемостью
Здравствуйте, коллеги-технари.
Предположим, у нас есть веб-сайт (PHP) с миллионами посетителей в месяц, и мы запускаем индекс SolR на веб-сайте с 4 миллионами размещенных документов. Solr работает на 4 отдельных серверах, где один сервер является...
3490 просмотров
schedule
27.08.2022
Как избежать одинарных кавычек в переменных в Solr DataImportHandler?
У меня есть DataImportHandler для импорта данных из базы данных SQL. Корневой объект Foo имеет много Bar . Таблица Bar использует Foo.Name в качестве внешнего ключа. Некоторые имена Foo заключены в одинарные кавычки, например STW's ....
1379 просмотров
schedule
25.09.2022
Solr dataimporthandler, не может использовать временные метки объекта
Я использую обработчик импорта данных solr для ввода данных из нескольких источников, используя несколько объектов.
Когда я запускаю импорт, файл dataimport.properties имеет несколько временных меток для каждого отдельного объекта.
Я хочу...
245 просмотров
schedule
30.09.2022
проблема дельта-импорта в solr DIH
Когда я запускаю команду full_import, она работает нормально. Обновленные даты записываются в файл dataimport.properties. Когда я запускаю дельта-импорт, он дает ошибку индексации. Откатил все изменения. Файл dataimport.properties уже создан и...
5097 просмотров
schedule
06.12.2022
DataImportHandlerException: невозможно выполнить запрос
Я пытался найти свою конкретную проблему, но не нашел решения. Я также прочитал вики на DIH и, похоже, все настроил правильно, но мой запрос все еще не работает. спасибо за помощь
Я использую Solr 3.1 с Tomcat 6.0 Windows Server 2003 r2 и SQL...
6020 просмотров
schedule
01.05.2023
Обработка гибридной базы данных MySQL и XML в индекс Solr
Проблема:
Таблица в MySQL с несколькими обычными полями и одним текстовым полем, содержащим XML.
Мне нужно использовать обработчик импорта данных Solr для обработки этой таблицы в индекс Solr. Однако поле XML необходимо разбить на несколько...
196 просмотров
schedule
27.06.2023
Не удалось создать экземпляр прослушивателя org.apache.solr.handler.dataimport.scheduler.ApplicationListener
Я пытаюсь настроить dataimportscheduler для своего индекса, когда добавляю:
<listener>
<listener-class>
org.apache.solr.handler.dataimport.scheduler.ApplicationListener
</listener-class>
</listener>
в...
1620 просмотров
schedule
12.11.2022