Вопросы по теме 'mapr'

Как разделить строки Spark RDD с помощью Deliminator
Я пытаюсь разбить данные в Spark в виде RDD Array[String] . В настоящее время я загрузил файл в RDD String . > val csvFile = textFile("/input/spam.csv") Я хотел бы разделить на , разделитель.
10616 просмотров

Вызвать свинью с помощью oozie - org.apache.pig.Main код выхода [2]
Я пытаюсь вызвать действие Pig в Oozie и работаю со следующим: Oozie v3.3.2 Свинья v0.12.1-mapr Hadoop v1.0.3 mapr M5 На данный момент я могу вызвать действие Java с помощью Oozie. Однако, когда я пытаюсь вызвать...
1130 просмотров
schedule 30.10.2021

Инструкции по работе с песочницей MapR
После того, как я установил песочницу MapR на свой ноутбук, как практиковать примеры упражнений в песочнице MapR? Где найти инструкцию? Спасибо. Венкат
452 просмотров
schedule 11.09.2021

Чем отличается ч / б Mapr Vs Cloudera?
Cloudera - это бесплатная и корпоративная версия, но MapR - это почти корпоративная версия. Почему? есть ли между ними большая разница?
1824 просмотров
schedule 23.09.2021

Использование разделов (с partitionBy) при записи дельта-озера не имеет никакого эффекта
Когда я изначально пишу дельта-озеро, используя разделы (с partitionBy) или нет, это не имеет никакого значения. Использование повторного разбиения на тот же столбец перед записью изменяет только количество паркетных файлов. Явное разделение...
893 просмотров

Как получить свойства конфигурации по умолчанию в MapR
Я пытаюсь найти свойства по умолчанию в MapR Hadoop . С веб-сайта HPE (теперь MapR принадлежит HPE) получено чтобы узнать путь к файлам конфигурации. Но эти файлы показывают только некоторые конкретные свойства, а не все.
45 просмотров
schedule 27.09.2021

HIVE: Ошибка вставки запроса с ошибкой java.lang.OutOfMemoryError: превышен предел накладных расходов GC
Запрос на вставку моего улья не удался из-за ошибки ниже: java.lang.OutOfMemoryError: превышен предел накладных расходов GC Данные в таблице 2 = 1,7 ТБ Запрос: set hive.exec.dynamic.partition.mode= nonstrict;set...
826 просмотров
schedule 02.03.2022

Поддерживается ли Hive on Spark кластером MapR?
Я хотел бы выполнять запросы улья на Spark. В настоящее время мы используем mapreduce в качестве механизма выполнения. пожалуйста, дайте мне знать, есть ли поддержка Spark для выполнения запросов куста в кластере MapR ?. ранее я выполнял запросы...
127 просмотров
schedule 26.03.2022

Как сохранить файл в MapR HDFS с помощью Ruby
Есть ли способ сохранить файл в HDFS с помощью дистрибутива MapR Hadoop из Ruby? По-видимому, существует Thrift API под названием thriftfs , который позволяет взаимодействовать с HDFS от клиентов, но похоже, что он не связан с MapR.
323 просмотров
schedule 23.05.2022

будет ли SQL-запрос mapR/Apache Drill распределять работу на каждый узел или это будет такая же скорость, как и в SQL RDBMS?
Я столкнулся с запросом к базе данных, написанным на R, который работает с хранилищем данных mapR с использованием драйвера Apache Drill. Из-за потолка производительности с моей программой около 700 000 строк я изучаю возможность использования другой...
93 просмотров
schedule 07.07.2022

Пользовательские журналы Spark Executor [дубликаты]
Я предоставляю пользовательские свойства log4j для отправки искры следующим образом: spark-submit --master yarn --queue qqqq \ --driver-java-options "-Dlog4j.configuration=file:/absolute path/to properties file/driver-log4j.properties" \...
260 просмотров
schedule 01.07.2022

Как получить размер таблицы mapr-db?
Я выполнил следующие шаги для создания таблицы mapr-db: $ pwd /mapr/cluster1/user/project $ls bin src $ maprcli volume create -name project-tables-vol -path /user/project/tables \ -quota 100G -topology /data/rack1 $ ls bin src...
961 просмотров
schedule 30.07.2022

Запуск службы impala в одиночку в докере
Я пытаюсь установить impala в контейнер докера (используя документацию MAPR). В этом докере я запускаю только службу Impala и оставшийся куст, службы maprfs будут работать на физическом узле. При запуске сервера impala (демон impala) я получаю...
224 просмотров
schedule 01.08.2022

Apache Drill: ошибка создания таблицы при выборе из данных Json
Команда ниже работает нормально. SELECT TO_TIMESTAMP(`ts`,'yyyyMMddHHmmss') FROM dfs.tmp`/mapr/my.cluster.com/hive/cpf_sales.json Но когда я пытаюсь создать таблицу из оператора select, она выдает ошибку. Ниже те, которые я пробовал...
547 просмотров
schedule 19.08.2022

Проблема с импортом python для mapr_streams_python
Я играю с песочницей MapR и хотел бы импортировать некоторые данные в поток MapR с помощью python. Но у меня проблема с импортом, и я не знаю, почему. Я следовал инструкциям с веб-сайта MApR (см. ссылку в конце этого поста) и везде искал подсказку,...
157 просмотров
schedule 21.08.2022

Проблемы с путями к классам в MAPR
Я запускаю клиентскую программу MAPR. Я получаю следующее исключение: java.lang.UnsatisfiedLinkError: com.mapr.security.JNISecurity.SetParsingDone()V в com.mapr.security.JNISecurity.SetParsingDone(собственный метод) в...
1352 просмотров
schedule 02.09.2022

HBase: создать таблицу с той же схемой, что и существующая таблица.
Я пробовал искать на форуме, где я могу создать новую пустую таблицу hbase из существующей схемы таблицы hbase, но не смог найти. Чтобы быть более точным, предположим, что у меня есть таблица с несколькими семействами столбцов и множеством...
9715 просмотров
schedule 10.09.2022

Налагает ли HBase максимальный размер на строку?
Вопрос высокого уровня: Налагает ли HBase максимальный размер строки, который является общим для всех дистрибутивов (и, следовательно, не является артефактом реализации), либо с точки зрения хранимых байтов , либо с точки зрения количества ячеек...
5871 просмотров
schedule 06.10.2022

Подключение к удаленному Mapr Hive через JDBC
Этот вопрос похож, но не тот же, что и Hive JDBC getConnection не возвращает . Но все же речь идет об удаленном подключении. Также хранилище метаданных присутствует в каталоге, в котором был запущен hiveserver2. У нас есть работающий кластер...
16214 просмотров
schedule 04.11.2022

pip install pandas не смог найти загрузки, удовлетворяющие требованиям pandas
пока я пытаюсь установить pandas, получаю ошибку ниже. не могли бы вы предложить мне решить? [mapr@csdssqwqasw22 ~]$ pip install pandas Загрузка/распаковка pandas Не удается получить базовый URL индекса https://pypi.python.org/simple/ Не...
1147 просмотров
schedule 06.03.2023