Производительность при записи событий в таблицу Cassandra

Запрос 1: данные о событиях с устройства хранятся в таблице Cassandra. Очевидно, это данные временного ряда. Если нам нужно сохранить, насколько старые датированные события (если они кэшированы на устройстве из-за какой-либо проблемы) в текущее время, возникнут ли проблемы с производительностью? Если да, как этого избежать?

Вопрос 2: это хорошая практика - записывать событие в таблицу Cassandra, как только событие приходит? Или мы будем ставить его в очередь на какое-то время, чтобы записать несколько событий за один раз, если это значительно улучшит производительность записи Cassandra?


person Martin    schedule 09.02.2018    source источник


Ответы (1)


Q1: все зависит от дизайна стола. Обычно это не должно быть проблемой, но это может зависеть от ваших шаблонов доступа и стратегии уплотнения. Если у вас есть структура таблицы, поделитесь ею.

Q2: отдельные записи не должны быть проблемой, но это действительно зависит от ваших требований к пропускной способности. Если вы напишете несколько точек данных, которые принадлежат одному ключу раздела, вы потенциально можете использовать незарегистрированные пакеты, и в этом случае Cassandra выполнит только одну запись для нескольких вставок, которые находятся в этом пакете. Прочтите этот документ.

person Alex Ott    schedule 09.02.2018