Высокая доступность SolrCloud во время операции индексации

Я тестирую функцию высокой доступности SolrCloud. Я использую следующую настройку

  • 8 хостов linux
  • 8 осколков
  • 1 лидер, 1 реплика / хост
  • Использование Curl для операции обновления

Я пробовал индексировать 80К документов на репликах (10К / реплика параллельно). В процессе индексации я остановил 4 узла Leader. После завершения индексирования из 80 000 документов индексируется только 79 808 документов.

Это ожидаемое поведение? На мой взгляд, реплика должна позаботиться об индексировании, если лидер не работает.

Если это ожидаемое поведение, любые шаги, которые могут быть предприняты со стороны клиента, чтобы избежать такой ситуации.


person Saurabh Saxena    schedule 24.09.2013    source источник


Ответы (1)


Я предлагаю вам использовать CloudSolrServer для обновления индекса solrcloud. Поскольку он заботится о неработающих узлах, не получает никаких запросов на обновление и направляет все последующие запросы на соответствующий узел в кластере. Еще одна вещь, которую вам нужно убедиться, есть ли у всех ваших 80k документов уникальное значение поля, и его значение действительно уникально для всех документов

person Community    schedule 28.10.2013