Я работаю над искровой программой, в которой мне нужно загружать данные avro и обрабатывать их. Я пытаюсь понять, как создаются идентификаторы заданий для искрового приложения. Я использую приведенную ниже строку кода для загрузки данных avro.
sqlContext.read.format("com.databricks.spark.avro").load(путь)
Насколько я знаю, идентификаторы заданий будут создаваться на основе действий, встречающихся в программе. Моя работа запланирована на запуск каждые 30 минут. Когда я смотрю на сервер истории искр для этого приложения, я вижу, что для операции загрузки создается идентификатор задания. Это происходит только иногда, и журнал выглядит абсолютно нормально. Я использую искру 1.6.1
Мне любопытно узнать, создает ли операция загрузки новый идентификатор задания в приложении?