Как процесс записи / чтения Spark через соединитель Spark-Cassandra отличается от процесса чтения / записи CQLSH

Я новичок в Spark, пытаюсь понять, как искра выгодна при использовании его через разъем Spark-Cassandra на кластере Cassandra.

  1. Как запись (пример savetocassandra) в Cassandra работает через соединитель Spark-Cassandra (запускает SQL-запросы, задействован ли еще узел координатора?
  2. Как чтение в Cassandra работает через соединитель Spark-Cassandra (запускает SQL-запросы), задействован ли еще узел координатора?
  3. Что заставляет Spark преодолевать нагрузку Cassandra при сканировании с высокой дальностью чтения кластера?
  4. Как выполняется запрос чтения cql с высоким диапазоном в кластере Cassandra через соединитель Spark-Cassandra?
  5. использование предложения IN через разъем Spark-Cassandra в кластере Cassandra является преимуществом?

person Community    schedule 31.10.2017    source источник


Ответы (1)


Вот хорошее объяснение. Я также рекомендую другие выступления Рассела, если вы хотите понять внутреннее устройство Spark-Cassandra-connector, Cassandra и Spark Optimizing for Data Locality - Рассел Спитцер (DataStax) https://www.youtube.com/watch?v=ikCzILOpYvA

person Artem Aliev    schedule 23.01.2018