Пример использования DataModel для входа в Cassandra

Я пытаюсь создать таблицу журнала приложений в Cassandra,

CREATE TABLE log(
  yyyymmdd varchar, 
  created timeuuid,  
  logMessage text,
  module text, 
  PRIMARY KEY(yyyymmdd, created)
);

Теперь, когда я пытаюсь выполнить следующие запросы, он работает должным образом,

select * from log where yymmdd = '20182302' LIMIT 50;

Вышеупомянутый запрос без группировки, своего рода глобальный.

В настоящее время я сделал вторичный индекс для «модуля», поэтому я могу выполнить следующее:

select * from log where yymmdd = '20182302' WHERE module LIKE 'test' LIMIT 50;

Теперь меня беспокоит отсутствие вторичного индекса. Есть ли эффективный способ запроса на основе модуля и получения данных (или) Есть ли лучший дизайн?

Также дайте мне знать о проблеме с производительностью в текущем дизайне.

cassandra data-modeling cassandra-3.0

Harry 22.02.2018 источник

Ответы (1)

arrow_upward
2
arrow_downward

Для выборки на основе module и даты вы можете использовать только другую таблицу, например:

CREATE TABLE module_log(
  yyyymmdd varchar, 
  created timeuuid,  
  logMessage text,
  module text, 
  PRIMARY KEY((module,yyyymmdd), created)
);

Это позволит иметь один раздел для каждой комбинации значений module и yyyymmdd, поэтому у вас не будет очень широких разделов.

Также учтите, что если вы создали вторичный индекс только для поля module - у вас могут возникнуть проблемы со слишком большими разделами (я предполагаю, что у вас очень ограниченное количество значений module?).

P.S. Вы используете чистую Кассандру или DSE?

Alex Ott 22.02.2018

comment

Я думал об этом решении, но оно ограничивало его запросом: 'select * from log, где yymmdd =' 20182302 'LIMIT 50; ', Потому что мне тоже нужны консолидированные логи модуля :( - Harry; 22.02.2018

comment

Да, я использую чистый apache Cassandra - Harry; 22.02.2018

comment

Как мы обсуждали ранее, даже если у меня есть вторичный индекс, если я сделаю запрос по partitionId, он перейдет непосредственно к узлу раздела, а затем будет искать таблицу вторичного индекса, верно? Также за один день мы с трудом пересекаем 100 тысяч логов. - Harry; 22.02.2018

comment

Это немного сложнее - он все равно может поразить несколько машин, чтобы найти значения. В этом сообщении блога вторичные индексы описаны более подробно: datastax. ru / dev / blog / - Alex Ott; 22.02.2018

comment

Учитывая ваше решение, есть ли способ прочитать все консолидированные журналы модуля? - Harry; 22.02.2018

comment

Это действительно зависит от ваших требований - вы можете вставить в несколько таблиц из своего приложения или вставить в одну таблицу и использовать вторичные индексы, или материализованные представления для запроса по другим комбинациям столбцов, или даже использовать индексы SASI (doanduyhai.com/blog/?p=2058). Все это зависит от требований к задержке и т. Д. - например, как часто к этим данным будут обращаться? - Alex Ott; 22.02.2018

comment

Это журнал, поэтому он будет часто запрашиваться - Harry; 22.02.2018

comment

Но также какая задержка требуется - загрузка ее для пользовательской консоли или что-то в этом роде? Если это действительно требует очень низкой задержки, то несколько таблиц, адаптированных для этого, могут работать лучше. - Alex Ott; 22.02.2018

comment

Проверьте это: stackoverflow.com/questions/49135405/ - Harry; 07.03.2018

comment

Мне нужна ваша помощь в этом: stackoverflow.com/questions/49219277/ < / а> - Harry; 11.03.2018

Вопросы по теме

eventReactive с 2 кнопками действий на 2 вкладках
Добавить результат в TestCaseSource
три столбца в одну дату
Как открыть URL-адрес в WebView через .js в создателе кокосов
Highchart GMT и смещение в один час
проблема с отключением дат в datepicker
Получить описание текущего шага, вызываемого из файла BDD
журнал данных ракетки - журнал данных с отрицанием?
Не удается проиндексировать массив int RavenDB
Как использовать команду Scaffold-DbContext в VS Code
Взрывающийся градиент тензорного потока
Итерация по столбцу фрейма данных pandas и оценка с помощью оператора if и передача значений столбца в пустой список/словарь
Заполнить таблицу данных; Неверный ответ JSON
Получить точное время для удаленного сервера
Сбор элементов в массиве JSON
Динамический компонент круговой диаграммы D3 в Angular
Данные о пользовательских событиях в Firebase Events
Laravel 5.2 - проблема с веб-сервисами
Как повернуть трехмерный график в Matplotlib вокруг любой оси
Представление класса базы данных Java SQL