У меня есть коллекция PCollection, которая состоит из столбца идентификатора и семи столбцов значений. Для каждого идентификатора есть несколько строк.
Я хотел бы вычислить среднее значение семи столбцов для каждого уникального идентификатора.
Есть ли способ добиться этого без программного прохождения каждого элемента и создания пары ключ / значение для каждого элемента?