Распределение сегментов Elasticsearch для небольших индексов

У меня есть настройка elasticsearch со 192 активными индексами в диапазоне от нескольких сотен МБ до 5 ГБ каждый. Я читал, что для случая использования logstash с индексами 1 ГБ вам следует использовать только 1 осколок. Разница с моей настройкой в том, что у меня будет больше пользователей (оценка до 100), ожидающих быстрого ответа. Я намерен иметь 1 реплику для надежности.

Будет ли по-прежнему подходящим для моего варианта использования наличие 1 осколка на индекс?

sharding

Ben McAlindin 29.12.2015 источник

comment

Если вас больше всего беспокоит производительность поиска, вы можете легко добавлять или удалять реплики, не нужно беспокоиться о размере сегментов для повышения производительности поиска по небольшим индексам. - michaelb 30.12.2015

Ответы (2)

arrow_upward
2
arrow_downward

Одним словом: да.

Необходимость создания нескольких первичных сегментов проистекает из необходимости изолировать документы, чрезмерных подсчетов (например, когда вы находитесь в объеме миллиардов документов) или повышения пропускной способности записи (писать документы в большем количестве мест, тем самым снижая индивидуальную нагрузку).

На практике вы хотите сегментировать на основе вашего варианта использования, если только вы не входите в один из этих первых двух сценариев (изоляция или экстремальное количество).

Вы много читаете?
Вы много пишете? (Реже, но бывает)

Если вас много читают, как это бывает в большинстве случаев использования, то меньшее количество шардов поможет вам, ограничив размер запроса (меньше мест для поиска). Учитывая, что размеры ваших сегментов также относительно малы (я считаю, что размер менее 5 ГБ является относительно небольшим), вы можете легко обойтись одним основным сегментом, и это должно повысить производительность вашего поиска за счет делать это.

Индексы с одинаковыми сопоставлениями, но крошечные («несколько сотен МБ»), вероятно, должны быть объединены , если вы выполняете поиск по ним. Если они независимы, то это действительно не имеет значения, и изоляция кажется хорошей практикой за счет небольшого раздувания состояния вашего кластера (с каждым индексом).

pickypg 30.12.2015

comment

Спасибо. Да, я могу посмотреть на объединение некоторых из более мелких. Мы планировали закрывать их в скользящие месяцы, но, возможно, было бы лучше закрывать их большими партиями как один индекс. - Ben McAlindin; 31.12.2015

arrow_upward
2
arrow_downward

Взгляните на этот блог: https://qbox.io/blog/optimizing-elasticsearch-how-many-shards-per-index. У него есть много хороших указаний на сегментирование и определение размеров сегментов.

Однако вопрос, который вы действительно должны задать себе: насколько легко это изменить? Когда дело доходит до размеров и масштабируемости, ответ часто - «это зависит от обстоятельств» - и реальный вопрос: как быстро вы сможете перенастроить?

Это могло бы, например, означает, что вы разрабатываете свое приложение таким образом, чтобы можно было быстро переупорядочить данные в новый индекс, что вы используете псевдонимы, чтобы вы могли фактически изменить эти вещи, где находятся ваши данные (не только в Elastic, я надеюсь) и т.п.

Построив систему с самого начала, чтобы вы могли быстро перестроить индикаторы, вы можете экспериментировать с размерами и, что более важно, изменять их по мере изменения ваших потребностей.

Lars Baunwall 29.12.2015

comment

Да, это статья, которая оставила меня с этим вопросом. Я надеюсь создать быстрый процесс переиндексации, хотя он во многом зависит от предоставленных мне ресурсов. - Ben McAlindin; 30.12.2015

Распределение сегментов Elasticsearch для небольших индексов

Ответы (2)

Вопросы по теме