Почему автономный главный график драйверов на воркере?

schedule() в Master.scala показывает, что первая задача расписания - это планирование драйверов для рабочих. Поскольку Master запускает только автономный режим, драйверы будут работать на клиенте вне кластера Spark.

Зачем мастеру нужно запланировать воркера для запуска драйвера?

apache-spark apache-spark-standalone

CCong 21.05.2017 источник

Ответы (1)

arrow_upward
1
arrow_downward

Если вы имеете в виду private def schedule (): Unit, этот метод планирует драйверы приложений Spark, которые spark-submit использовали --deploy-mode cluster.

Из Запуск приложений с помощью spark-submit (ссылка на которую имеется в Обзор режима кластера):

--deploy-mode Следует ли развертывать драйвер на рабочих узлах (cluster) или локально в качестве внешнего клиента (client) (по умолчанию: client)

В cluster режиме развертывания драйвер запускается на работнике в кластере (независимо от диспетчера кластера, Spark Standalone, Hadoop YARN или Apache Mesos). Как и исполнители Spark.

Jacek Laskowski 21.05.2017

Почему автономный главный график драйверов на воркере?

Ответы (1)

Вопросы по теме