Apache Nifi - отправка пакетных заданий Spark через Apache Livy

Я хочу запланировать мои искровые пакетные задания из Нифи. Я вижу, что есть ExecuteSparkInteractive, который отправляет искровые задания Ливи, но выполняет код, указанный в свойстве или из содержимого файла входящего потока. Как мне запланировать мои искровые пакетные задания из Nifi, а также предпринять различные действия, если пакетное задание завершилось неудачно или успешно?


person Apurba Pandey    schedule 18.07.2018    source источник


Ответы (1)


Вы можете использовать ExecuteProcess, чтобы запустить команду spark-submit. Но, похоже, вы ищете не инструмент управления DataFlow, а диспетчер рабочих процессов. Два отличных примера для менеджеров рабочих процессов: Apache Oozie и Apache Airflow.

Если вы все еще хотите использовать его для планирования искровых заданий, вы можете использовать GenerateFlowFile должен быть запланирован (на основном узле, поэтому он не будет планироваться дважды - если вы не хотите), а затем подключите его к процессору ExecuteProcess и заставьте его запустить команду spark-submit.

Для более сложного рабочего процесса я написал статью о :) Надеюсь, это поможет.

person Ben Yaakobi    schedule 18.02.2019
comment
Хорошая статья. Я уже сделал это несколько месяцев назад, и мой подход похож на ваш. Я написал специальный процессор для присоединения на основе условий. - person Apurba Pandey; 26.03.2019