Сколько места на диске выделено для столбца Cassandra с типом данных TEXT/VARCHAR?

Кажется, нет никакой возможности указать максимальное количество символов для столбца TEXT или VARCHAR в Cassandra v3, тогда сколько места на диске выделено для этого типа столбца? Мне нужна эта информация, чтобы оценить использование дискового пространства, поскольку у меня много столбцов TEXT.

В сети не могу найти подходящей информации. Пожалуйста, дайте несколько полезных ссылок в ваших ответах, если таковые имеются.

Заранее спасибо.


person Suren Aznauryan    schedule 22.01.2018    source источник
comment
Как насчет стандартного сжатия LZ4?   -  person xmas79    schedule 22.01.2018


Ответы (2)


Я использую клиент Datastax C для вставки в кластер cassandra. При вставке текстового столбца, известного как строковый тип данных, вам необходимо иметь переменную типа "const char *". Размер const char * фиксирован, и он принимает только количество используемых символов и даже не будет учитывать символ NULL. Таким образом, текст будет занимать размер в зависимости от того, сколько символов вы вставляете (и размер равен этому количеству байтов). Более того, когда мы извлекали данные обратно через запросы на чтение, мы проверили размер, и он равен количеству вставленных символов, а нуль в конце не инициализируется.

Если cassandra использует какой-либо механизм (например, метод сжатия LZ4) для сжатия данных, он будет уменьшен. Но нет возможности, что он будет иметь размер больше, чем размер символов ваших вставок. Поправьте меня, если я ошибаюсь.

person Chakri Stark    schedule 23.01.2018
comment
У вас есть ссылки на официальную документацию, содержащую утверждения, сделанные в вашем ответе? - person Suren Aznauryan; 24.01.2018
comment
Возможно, я не смогу получить правильную официальную информацию по этому поводу. Но я дам ссылки для процесса сжатия в документах cassandra-. datastax.com/en/cassandra/2.1/cassandra/operations/ А по поводу LZ4- issues.apache.org/jira/browse/CASSANDRA-11051 Но основное объяснение того, как символьный тип данных может иметь более одного байта. Итак, я думаю, что то, что я дал в ответ, явно удовлетворит ваше требование - person Chakri Stark; 24.01.2018

В Datastax есть действительно хорошее видео о том, как вы можете оценить размер данных. Рекомендую его посетить.

person Horia    schedule 22.01.2018