Почему автономный главный график драйверов на воркере?

schedule() в Master.scala показывает, что первая задача расписания - это планирование драйверов для рабочих. Поскольку Master запускает только автономный режим, драйверы будут работать на клиенте вне кластера Spark.

Зачем мастеру нужно запланировать воркера для запуска драйвера?


person CCong    schedule 21.05.2017    source источник


Ответы (1)


Если вы имеете в виду private def schedule (): Unit, этот метод планирует драйверы приложений Spark, которые spark-submit использовали --deploy-mode cluster.

Из Запуск приложений с помощью spark-submit (ссылка на которую имеется в Обзор режима кластера):

--deploy-mode Следует ли развертывать драйвер на рабочих узлах (cluster) или локально в качестве внешнего клиента (client) (по умолчанию: client)

В cluster режиме развертывания драйвер запускается на работнике в кластере (независимо от диспетчера кластера, Spark Standalone, Hadoop YARN или Apache Mesos). Как и исполнители Spark.

person Jacek Laskowski    schedule 21.05.2017