Вопросы по теме 'livy'

выполнять задания Spark с Livy, используя --master yarn-cluster, без внесения общесистемных изменений
Я хочу выполнить задание Spark через HTTP-вызов извне кластера с помощью Livy , где Spark jar уже существует в HDFS. Я могу spark-submit выполнить задание из оболочки на узлах кластера, например: spark-submit --class io.woolford.Main...
1325 просмотров
schedule 18.10.2021

почему Livy или Spark-JobServer вместо простого веб-фреймворка?
Я создаю RESTful API поверх Apache Spark. Выполнение следующего скрипта Python с spark-submit , похоже, работает нормально: import cherrypy from pyspark.sql import SparkSession spark = SparkSession.builder.appName('myApp').getOrCreate() sc =...
4251 просмотров
schedule 24.11.2021

Apache Nifi - отправка пакетных заданий Spark через Apache Livy
Я хочу запланировать мои искровые пакетные задания из Нифи. Я вижу, что есть ExecuteSparkInteractive , который отправляет искровые задания Ливи, но выполняет код, указанный в свойстве или из содержимого файла входящего потока. Как мне запланировать...
877 просмотров
schedule 07.03.2022

Как установить свойства конфигурации Spark с помощью Apache Livy?
Я не знаю, как программно передавать параметры SparkSession при отправке задания Spark в Apache Livy: Это задание Test Spark: class Test extends Job[Int]{ override def call(jc: JobContext): Int = { val spark = jc.sparkSession() //...
1445 просмотров
schedule 27.03.2022

Как пересобрать apache Livy с помощью scala 2.12
Я использую Spark 3.1.1, который использует Scala 2.12, и предварительно созданный Livy, загруженный с здесь использует Scala 2.11 (после распаковки можно было найти папку с именем repl_2.11-jars/ ). Ссылаясь на комментарий Александра...
313 просмотров
schedule 29.03.2022

Настройка внешних jar-файлов с помощью записной книжки HDI Jupyter Spark (Scala)
У меня есть внешний настраиваемый jar-файл, который я хотел бы использовать с записными книжками Azure HDInsight Jupyter; ноутбуки Jupyter в HDI используют Spark Magic и Livy. В первой ячейке записной книжки я пытаюсь использовать конфигурацию...
1488 просмотров

Внутренняя ошибка сервера: сеанс находится в состоянии ошибки запуска при выполнении примера задания Spark Livy
Ошибка «Внутренняя ошибка сервера: сеанс находится в состоянии запуска» при выполнении примера задания Spark Livy. Я установил Livy для доступа к apache-spark с помощью REST API и запустил сервер Livy. При запуске пробного приложения Spark Pi (как...
1003 просмотров
schedule 06.10.2023

Как убить искру / пряжу через livy
Я пытаюсь отправить искру через livy, используя rest api. Но если я запускаю один и тот же сценарий несколько раз, он запускает несколько экземпляров задания с разными идентификаторами задания. Я ищу способ убить задание искры / пряжи с тем же...
4906 просмотров
schedule 20.01.2023

Не удалось найти банку в репозитории при сборке Livy с использованием пакета mvn clean
Я новичок в Ливии и строю Ливи, как сказал официал. Команда выглядит следующим образом: git clone https://github.com/apache/incubator-livy.git cd incubator-livy mvn package Затем я получаю сообщение об ошибке следующим образом:...
380 просмотров
schedule 08.06.2023

Ошибка при запуске Spark от livy
Я выполняю свою работу Spark, используя livy, однако я получаю исключение ниже java.util.concurrent.ExecutionException: java.io.IOException: Internal Server Error: "java.util.concurrent.ExecutionException: org.apache.livy.rsc.rpc.RpcException:...
922 просмотров
schedule 01.12.2022

Как установить spark.driver.extraClassPath через Apache Livy в кластере Azure Spark?
Я хотел бы добавить некоторую конфигурацию, когда задание Spark отправляется через Apache Livy в кластер Azure. В настоящее время для запуска Spark Job через Apache Livy в кластере я использую следующую команду curl -X POST --data '{"file":...
1304 просмотров
schedule 19.03.2023

Ошибка отражения при создании сеанса искры через Ливи
Я создаю искровую сессию через LivyClient. Код для создания сеанса - var client: LivyClient = null try { client = new LivyClientBuilder() .setURI(new URI("http://127.0.0.1:4141")) .build(); val pi =...
444 просмотров
schedule 16.10.2022

как установить livy.server.session.timeout на ускорение кластера EMR?
Я создаю кластер EMR и использую jupyter notebook для запуска некоторых искровых задач. Мои задачи умирают примерно через 1 час выполнения, и ошибка: An error was encountered: Invalid status code '400' from...
9066 просмотров
schedule 23.05.2023

Почему задание искровой отправки оставляет процесс, запущенный на главном узле кластера (EMR)?
Я отправляю искровое задание Ливи через лямбда-функцию AWS. Задание выполняется до конца программы драйвера, но затем не завершается. Если в конец программы драйвера добавлены spark.stop () или sc.stop (), задание Spark завершится в диспетчере...
343 просмотров
schedule 18.07.2023

Состояние сеансов AWS EMR Livy отключено
Я использую EMR с livy, но Livy убивает некоторые сеансы, есть ли способ дождаться завершения других задач вместо того, чтобы убивать эти сеансы? Спасибо, Вот результат этих сеансов убийства: Цитата Приложение YARN Diagnostics...
898 просмотров
schedule 29.04.2023

Сбой загрузки LivyClient с py4j.Py4JException: ошибка при получении нового канала связи
Я пытаюсь отправить искровое задание через Apache Livy, но метод uploadJar LivyClient не работает. Это код (очень похожий на пример PiJob): LivyClientBuilder builder = new LivyClientBuilder(); LivyClient client =...
211 просмотров
schedule 04.03.2023

Есть ли какие-то другие настройки, которые нужно сделать вместе с Livy server (livy.conf)?
Я установил докер для пряжи hadoop, и я пытаюсь настроить живой сервер apache для выполнения вызовов API для отправки заданий. В журналах ниже показано, что livy-сервер запускается на определенное время и останавливается автоматически. 19/08/17...
342 просмотров

Пакеты Python не импортируются в AWS EMR
Я пытаюсь отправить задание в кластер EMR через Livy. Мой сценарий Python (для отправки задания) требует импорта нескольких пакетов. Я установил все эти пакеты на главный узел EMR. Основной сценарий находится на S3, который вызывается сценарием для...
731 просмотров
schedule 07.07.2023

Вызов API REST Apache Livy из Java
Мы используем Apache Livy для чтения данных из объектного хранилища в кластере Spark. Apache Livy API: POST http: // server: port / sessions / {sessionId} / statement Полезная нагрузка запроса: {"code":" val df =...
306 просмотров
schedule 20.05.2023

Настройка spark.local.dir в Pyspark/Jupyter
Я использую Pyspark из блокнота Jupyter и пытаюсь записать большой паркетный набор данных в S3. Я получаю сообщение об ошибке "Нет свободного места на устройстве". Я поискал и выяснил, что это происходит из-за того, что /tmp заполняется. Теперь я...
2960 просмотров
schedule 22.10.2023