начало работы со искрой Я хотел бы знать, как flatmap
или explode
фрейм данных.
Он был создан с использованием df.groupBy("columName").count
и имеет следующую структуру, если я его соберу:
[[Key1, count], [Key2, count2]]
Но я бы предпочел иметь что-то вроде
Map(bar -> 1, foo -> 1, awesome -> 1)
Что является правильным инструментом для достижения чего-то подобного? Плоская карта, взрыв или что-то еще?
Контекст: я хочу использовать spark-jobserver. Кажется, что он дает значимые результаты (например, работающую сериализацию json) только в том случае, если я предоставляю данные в последней форме.