Я хочу передать более одного имени столбца в качестве параметра фрейму данных.
val readData = spark.sqlContext
.read.format("csv")
.option("delimiter",",")
.schema(Schema)
.load("emp.csv")
val cols_list1 = "emp_id,emp_dt"
val cols_list2 = "emp_num"
val RemoveDupli_DF = readData
.withColumn("rnk", row_number().over(Window.partitionBy(s"$cols_list1").orderBy(s"$cols_list2") ))
Приведенный выше код работает, если у меня есть одно имя столбца, тогда как с двумя или более столбцами он дает ошибку ниже.
Исключение в потоке main org.apache.spark.sql.AnalysisException: не удается разрешить 'emp_id,emp_dt
'
Используется версия Scala 2.x.