результаты округления в сводных табличных результатах (pyspark)

Привет, как бы я округлил это содержимое таблицы, выведенное этим кодом.

from pyspark.sql.functions import *
exprs = {x: "sum" for x in data2.columns[:4]}
data2.groupBy("Species").agg(exprs).show()

Я пытался

round(data2.groupBy("Species").agg(exprs),2).show() #not ok

data2.groupBy("Species").agg(exprs).show().round(2) # not ok

pyspark aggregate iris-dataset

abdoulsn 29.10.2019 источник

Ответы (1)

arrow_upward
3
arrow_downward

round работает только с одним столбцом. Поэтому вы должны вызывать его для каждого столбца, например.

agg_cols = data2.columns[:4]
exprs = [sum(col(x)).alias(x) for x in agg_cols]
aggregated_df = data2.groupBy("Species").agg(*exprs)
aggregated_df.select(col("Species"), *[round(c, 2) for c in agg_cols]).show()

Paul 29.10.2019

comment

у меня такая ошибка TypeError: Column is not iterable - abdoulsn; 30.10.2019

comment

В какой строке? Можете ли вы проверить, что agg_cols — это список строк? - Paul; 30.10.2019

comment

Да, agg_cols — это список строк. Это исходит из этой линии. aggregated_df = data2.groupBy("Species").agg(exprs) - abdoulsn; 30.10.2019

comment

Я отредактировал ответ. Не могли бы вы попробовать еще раз, пожалуйста? - Paul; 30.10.2019

результаты округления в сводных табличных результатах (pyspark)

Ответы (1)

Вопросы по теме