Вопросы по теме 'apache-spark-1.4'
Утечка памяти Spark off heap в Yarn с прямым потоком Kafka
Я запускаю искровую потоковую передачу 1.4.0 на Yarn (дистрибутив Apache 2.6.0) с java 1.8.0_45, а также с прямым потоком Kafka. Я также использую Spark с поддержкой scala 2.11.
Проблема, которую я вижу, заключается в том, что контейнеры драйвера...
1544 просмотров
schedule
04.10.2021
Найдите размер данных, хранящихся в rdd, из текстового файла в apache spark
Я новичок в Apache Spark (версия 1.4.1). Я написал небольшой код для чтения текстового файла и сохранил его данные в Rdd.
Есть ли способ получить размер данных в rdd.
Это мой код:
import org.apache.spark.SparkContext
import...
7027 просмотров
schedule
01.11.2021
Databricks - как создать библиотеку с обновленными артефактами maven
Изначально мы создали библиотеку в блоках данных, используя артефакт maven. Мы видим, что все банки присутствуют в библиотеке, и обратите внимание, что этот артефакт maven наш.
Мы обнаружили несколько проблем с артефактом. Исправлено и обновлено...
198 просмотров
schedule
15.03.2022
Как оптимизировать перетасовку в приложении Apache Spark
Я запускаю потоковое приложение Spark с двумя рабочими. Приложение имеет операции соединения и объединения.
Все пакеты завершаются успешно, но было замечено, что метрики разлива случайного воспроизведения не согласуются с размером входных или...
36941 просмотров
schedule
15.11.2022
Сборка Apache Spark с использованием SBT: недействительный или поврежденный файл jar
Я пытаюсь установить Spark на свой локальный компьютер. Я следил за это руководство. Я установил JDK-7 (также есть JDK-8 ) и Scala 2.11.7 . Проблема возникает, когда я пытаюсь использовать sbt для сборки Spark 1.4.1 . Я получаю следующее...
6771 просмотров
schedule
27.03.2023
Выберите значения из столбца фрейма данных
Я хотел бы рассчитать разницу между двумя значениями из одного столбца. Сейчас мне просто нужна разница между последним значением и первым значением, однако использование последнего (столбца) возвращает нулевой результат. Есть ли причина, по которой...
862 просмотров
schedule
13.06.2023