в Apache Spark мы много раз используем RDD forEach для оценки или обработки всех данных в RDD ... Я хочу знать, что эквивалентно тому же в Apache Flink ??
Эквивалент RDD для каждой искры во Flink
Ответы (2)
Во Flink нет эквивалента. Однако вы можете использовать map()
и поместить туда свою пользовательскую функцию.
Просто для уточнения:
- RDD - это концепция Spark - Flink действительно работает с потоками данных.
forEach
вызывает функцию для каждого элемента, но не изменяет базовые данные (таким образом, используяmap()
во Flink, вам нужно добавить «функцию идентификации с побочным эффектом», т. Е. UDF вашей карты должен делать то, что делает каждый UDF, плюс испустить входную запись без изменений.)
person
Matthias J. Sax
schedule
28.06.2016
Начиная с версии 1.2 Flink предлагает ProcessFunction
, который более или менее аналогичен forEach
в Spark, поскольку он вызывается для каждого элемента потока.
person
David Anderson
schedule
13.05.2017