Я начал читать о больших данных и Hadoop, поэтому этот вопрос может показаться вам очень глупым.
Это то, что я знаю.
Каждый преобразователь обрабатывает небольшой объем данных и выдает промежуточный результат. После этого у нас есть этап перемешивания и сортировки.
Теперь Shuffle = перемещение промежуточного вывода в соответствующие редукторы, каждый из которых имеет дело с определенной клавишей/клавишами.
Итак, может ли в одном узле данных работать код Mapper и Reducer, или у каждого из них разные DN?