Статьи по теме apache-tez

Вопросы по теме 'apache-tez'

Разница между hive.tez.container.size и tez.task.resource.memory.mb

Не мог бы кто-нибудь узнать и объяснить мне, пожалуйста, разницу между этими настройками Tez? hive.tez.container.size и tez.task.resource.memory.mb Благодарю.

3936 просмотров

10.10.2021

Как задания wordCount mapReduce запускаются на кластере пряжи hadoop с помощью apache tez?

Как говорится на странице github tez , tez очень прост и в своей основе состоит всего из двух компонентов: Механизм конвейера обработки данных и Мастер для приложения обработки данных, с помощью которого можно объединить произвольные...

620 просмотров

hadoop mapreduce yarn apache-tez

13.03.2022

Как запустить куст запросов и получить идентификатор приложения через журнал

Я пишу сценарий оболочки, который выполняет команду улья, записывая журнал и выводящую информацию в два отдельных файла: hive -S -f pdr_extrator.sql 2> pdr_extrator_log.txt | sed 's / [\ t] / | / g' 1> pdr_extrator_out.txt Файл журнала...

675 просмотров

hadoop hive yarn apache-tez

29.03.2022

Уменьшите время выполнения большого запроса

Мой запрос обрабатывает этот запрос более 30 минут. Он действительно работает с очень большим набором данных, однако мне может не хватать чего-то базового, что может сократить время выполнения. Запрос работает на многих этапах редуктора, на каждом...

38 просмотров

hadoop hive hiveql query-performance apache-tez

07.04.2022

маппер hive-on-tez застрял в ИНИЦИАЛИЗАЦИИ с общим количеством контейнеров, равным -1 при доступе к данным на S3 / MinIO

У меня есть настройка Hadoop + Hive + Tez с нуля (то есть я развернул ее компонент за компонентом). Hive настроен с использованием Tez в качестве механизма выполнения. В текущем состоянии Hive может получить доступ к таблице в HDFS, но не может...

420 просмотров

amazon-s3 hadoop hive minio apache-tez

15.04.2022

Невозможно запустить латинский скрипт Pig на Apache Tez

У меня есть псевдораспределенная машина Ubuntu с одним кластером. Я написал простой свиной латинский скрипт, который отлично работает при использовании mapreduce в качестве режима выполнения. Но когда я использую tez в качестве режима выполнения с...

736 просмотров

hadoop apache-tez apache-pig

15.06.2022

hive на tez выдает java.lang.NoSuchMethodError

Я развернул tez и настроил hive для работы с tez. Простой запрос не выполняется на этапе редуктора. Это вызывает эту ошибку: Статус: выполняется (выполняется в кластере YARN с идентификатором приложения application_1469020577348_0014)...

714 просмотров

hive apache-tez

11.09.2022

Ошибка запроса Hive при попытке использовать механизм TEZ

Я пытаюсь выполнить приведенный ниже запрос, используя механизм TEZ, который успешно выполнен в движке MR. set hive.execution.engine=tez;SET hive.exec.dynamic.partition = true; SET hive.exec.dynamic.partition.mode = nonstrict;SET...

241 просмотров

hadoop hive apache-tez

13.09.2022

Создание индекса Hive с помощью TEZ

Можно ли генерировать индексы с помощью Tez вместо задания MR? Когда мы пытаемся установить hive.execution.engine=Tez и пытаемся сгенерировать индекс, создание индекса завершается ошибкой. Ниже приведен список команд, которые я использовал:...

2012 просмотров

hadoop hive apache-tez

17.09.2022

Почему hdfs выбрасывает исключение LeaseExpiredException в кластере Hadoop (AWS EMR)

Я получаю исключение LeaseExpiredException в кластере hadoop - tail -f /var/log/hadoop-hdfs/hadoop-hdfs-namenode-ip-172-30-2-148.log 2016-09-21 11: 54: 14,533 INFO BlockStateChange (обработчик 10 IPC-сервера на 8020): BLOCK *...

4247 просмотров

amazon-web-services hadoop apache hive apache-tez

07.12.2022

Улей проблем с приемом данных: java.lang.OutOfMemoryError: невозможно создать новый собственный поток

Я новичок в улье, и у меня возникла одиссея проблем с получением большого (1 ТБ) файла HDFS в секционированную управляемую таблицу Hive. Не могли бы вы помочь мне обойти это? Мне кажется, что у меня где-то плохая конфигурация, потому что я не могу...

506 просмотров

hive hiveql hortonworks-data-platform apache-tez hive-query

16.10.2022

Сокращение картографов и редукторов для простого запроса к очень большой таблице/представлению в Hive

У нас есть простой запрос к таблице/представлению размером примерно 5 ТБ. Мы выполняем ETL и, наконец, добавляем данные в основную таблицу, добавляя раздел. Но поскольку данные, которые мы обрабатываем, огромны, запрос порождает более 4000...

939 просмотров

hadoop hdfs hive query-optimization apache-tez

20.04.2023

Запрос занимает время, несмотря на добавление настроек сеанса

Ниже приведен запрос, сгенерированный ETL. Запрос - SELECT infaHiveSysTimestamp('SS') as a0, 7991 as a1, single_use_subq30725.a1 as a2, SUBSTR(SUBSTR(single_use_subq30725.a2, 0, 5), 0, 5) as a3, CAST(1 AS SMALLINT) as a4,...

45 просмотров

hadoop hive hiveql yarn apache-tez

17.12.2022

Название вакансии для Tez job в билайне и посмотреть в YARN

Я использую Beeline и хотел бы установить конкретное имя для задания TEZ, например, я использую mapreduce.job.name для задания MapReduce. Я пробовал hive.query.name , но в yarn application -list это не имеет никакого значения. Некоторые...

1335 просмотров

hadoop hiveql yarn beeline apache-tez

08.05.2023

Запрос Apache Hive на Tez FileNotFoundException

Я получаю это исключение при выполнении запроса Hive в Tez с Hive 2.3.6 и Tez 0.9.2 Я знаю, что Tez настроен правильно, потому что я могу вручную запускать задания сокращения карты через Hadoop. Dag submit failed due to...

204 просмотров

hive yarn apache-tez

16.02.2023

Hive недоступен через Spark. В среде Kerberos: клиент не может пройти аутентификацию через: [TOKEN, KERBEROS]

Привет всем, я запускаю Spark (2.4.4) в среде kerberos, я написал код для запроса таблицы Hive через Spark. Я делаю kinit также в команде spark-submit, но все равно сталкиваюсь с java.io.IOException:...

273 просмотров

apache-spark hadoop hive apache-tez kerberos-delegation

25.12.2022

Оценка размера контейнера Tez относительно длины входного разделения

Итак, когда Tez выбирает количество картографов для запуска, он смотрит на количество контейнеров, которые могут работать параллельно (доступные слоты), волновой фактор, местоположение данных в стойке, максимальный размер разделения FileInputFormat,...

159 просмотров

google-cloud-dataproc hadoop hive yarn apache-tez

06.03.2023

как Hive на Tez определяет номера редукторов?

Как определить количество редукторов? Похоже, это как-то связано с предложением where. Я использую следующий SQL: без предикатов SELELT ip, port, count(1) AS cnt FROM tb_ipaddr GROUP BY ip, port; В этой работе 252 редуктора. с одним...

21 просмотров

hadoop hive apache-tez

01.02.2023