Моя конфигурация кластера выглядит следующим образом:
- 3-узловой кластер
- 128 ГБ оперативной памяти на узел кластера.
- Процессор: 16-ядерный HyperThreaded на узел кластера. Все 3 узла имеют мастер Kudu и сервер T-Server и Impala, один из узлов имеет каталог Impala и Impala StateStore.
Мои проблемы заключаются в следующем:
1) Мне трудно понять динамическое объединение ресурсов в Impala при выполнении одновременных запросов. Я пытался установить mem_limit, но безуспешно. Я также пробовал статический пул служб, но с этим также не смог добиться требуемого параллелизма. Даже с контролем доступа требуемый параллелизм не был достигнут.
I) The time taken for 1 query: 500-800ms.
II) But if 10 concurrent queries are given the time taken grows to 3-6s per query.
III) But if more than 20 concurrent queries are given the time taken is exceeding 10s per query.
2) Один из узлов моего кластера не берет нагрузку после отправки запроса, я проверил это по сводке запроса. Я пытался указать NUM_NODES как 0 и 1 для узла, который не берет на себя нагрузку, тем не менее сводка показывает, что узел не берет на себя нагрузку.