Я читаю искру исчерпывающее руководство, в котором говорится:
Python / R DataFrames существуют на одном компьютере, а не на нескольких машинах ... это ограничивает то, что вы можете делать с данным DataFrame, ресурсами, которые существуют на этом конкретном компьютере ..
поэтому мне интересно, почему Python dataFrame не может работать на нескольких машинах? и если это означает, что питоны не распространяются?
Обновление
есть ли у Python / R эквивалентный распределенный DataFrame, такой как Spark scala / java ?? DataFrame