У меня есть настройка Hadoop + Hive + Tez с нуля (то есть я развернул ее компонент за компонентом). Hive настроен с использованием Tez в качестве механизма выполнения.
В текущем состоянии Hive может получить доступ к таблице в HDFS, но не может получить доступ к таблице, хранящейся в MinIO (с использованием реализации s3a
файловой системы).
Как показано на следующем снимке экрана, при выполнении SELECT COUNT(*) FROM s3_table
,
- Казнь Tez застряла навсегда
Map 1
всегда вINITIALIZING
состоянииMap 1
всегда имеет общее количество-1
и ожидающее количество-1
. (почему-1
?)
Вещи уже проверены:
- Hadoop может без проблем получить доступ к MinIO / S3. Например,
hdfs dfs -ls s3a://bucketname
хорошо работает. - Hive-on-Tez может выполнять вычисления с таблицами в HDFS с помощью успешно и быстро сгенерированных сопоставителей и редукторов.
- Hive-on-MR может без проблем выполнять вычисления с таблицами на MinIO / S3.
Каковы могли быть возможные причины этой проблемы?
Прикрепление снимка экрана Tez UI:
Информация о версии:
- Hadoop 3.2.1
- Улей 3.1.2
- Tez 0.9.2
- МИНИО-РЕЛИЗ.2020-01-25T02-50-51Z