Мы изучаем SPARK для cassandra, чтобы преодолеть ограничения CQL.
Первоначально мы были ограничены CQL, но столкнулись с несколькими препятствиями/препятствиями при использовании RDBMS. Чтобы назвать несколько, как показано ниже
- Для сравнения >(больше чем) и ‹ (меньше чем) в столбце мы ограничены наличием столбцов в ключе кластеризации. Даже если у меня есть столбец в кластеризации, я все равно должен предоставить ключ раздела для выполнения ‹ или > по ключу кластеризации.
- Невозможно проверить значение NULL для любого значения столбца
- Чтобы запросить в любом столбце другой ключ раздела, мы должны создать индекс для этого столбца.
- ЗАКАЗАТЬ по столбцу, который не является КЛЮЧОМ КЛАСТЕРИЗАЦИИ
- СГРУППИРОВАТЬ ПО Ограничения
- Присоединяйтесь к столам
Я новичок в cassandra и часто пересматриваю свою схему из-за ограничений.
Следовательно, похоже на HIVE/PIG для HDFS. Какие дополнительные преимущества дает Spark по сравнению с CQL?