SolrCloud против автономного Solr

Я пытаюсь обновить стандартную установку Solr 4.x до Solr cloud 5.x. Я провел некоторое тестирование производительности между двумя и обнаружил огромные различия. На одном сервере в разное время я запускал следующее:

  • Облако Solr 5.2.1 и 5.3, 2 осколка, 2 реплики, 3 зоопарка
  • Стандарт Solr Оба имеют одинаковые конфигурации (solrconfig и т. д.).

У обоих одинаковые данные

При многократном выполнении примера запроса средний результат заключался в том, что стандартный Solr был в 5 раз быстрее, чем облачный Solr.

И обработчик импорта данных также был в 2 раза быстрее, чем стандартный solr.

Любые мысли, почему это несоответствие и как улучшить производительность solrcloud?


person Javadroider    schedule 09.09.2015    source источник
comment
В ранних версиях 5.x было несколько серьезных регрессий производительности для конкретных случаев использования, вы уверены, что разница заключается в Solrcloud, а не только в Solr?   -  person randomstatistic    schedule 15.09.2016


Ответы (1)


Мы выполнили аналогичное обновление с автономного solr до solrcloud 6.6 и столкнулись с аналогичными проблемами производительности.

Мы определили, что по мере добавления сегментов и репликаций производительность снижается, потому что ведущие узлы должны выполнять больше работы, отправляя данные индекса всем сегментам и репликациям. Я бы не рекомендовал использовать более одного сегмента, если только ваш индекс не настолько велик, что не помещается на одном диске.

В итоге мы реализовали только один сегмент с несколькими репликациями, чтобы удовлетворить наш вариант использования. После настройки свойств Java, ОЗУ и дискового пространства мы смогли получить solrcloud с одним сегментом и четырьмя репликациями, производительность которых лишь немного хуже, чем у автономного solr.

Я настоятельно рекомендую прочитать документацию solr на solrcloud и узнать, как она может удовлетворить или не удовлетворить ваш вариант использования. Нам никогда не приходилось «обновляться» до облака solr, поэтому в итоге мы потратили много времени на то, что даже не так хорошо и стабильно, как автономный solr.

person Simon Tower    schedule 12.12.2017