Мне нужно подключить искру к моему экземпляру красного смещения для генерации данных. Я использую Spark 1.6 со scala 2.10. Использовали совместимый разъем jdbc и разъем искрового красного смещения. Но я столкнулся со странной проблемой: я использую pyspark.
df=sqlContext.read\
.format("com.databricks.spark.redshift")\
.option("query","select top 10 * from fact_table")\
.option("url","jdbc:redshift://redshift_host:5439/events?user=usernmae&password=pass")\
.option("tempdir","s3a://redshift-archive/").load()
Когда я делаю df.show()
, это дает мне ошибку разрешения отказа в моем ведре. Это странно, потому что я вижу файлы, создаваемые в моем ведре, но их можно прочитать.
PS. Я также установил ключ доступа и секретный ключ доступа.
PS. Меня также путают файловые системы s3a и s3n. Используемый коннектор: https://github.com/databricks/spark-redshift/tree/branch-1.x