Вопросы по теме 'hive-metastore'
Основная цель MetaStore в Hive?
Я немного запутался в назначении MetaStore. Когда вы создаете таблицу в улье:
CREATE TABLE <table_name> (column1 data_type, column2 data_type);
LOAD DATA INPATH <HDFS_file_location> INTO table managed_table;
Итак, я знаю, что эта...
973 просмотров
schedule
19.10.2021
Чтение сжатого JSON в Spark
У меня есть данные, хранящиеся в S3 как файлы json в кодировке utf-8 и сжатые с использованием snappy / lz4. Я хотел бы использовать Spark для чтения / обработки этих данных, но Spark, похоже, требует суффикс имени файла ( .lz4 , .snappy ), чтобы...
309 просмотров
schedule
08.11.2021
Кластер HDInsight с хранилищем метаданных с использованием ошибки PowerShell
Я пытаюсь создать кластер HDInsight в Azure с Metastore с помощью сценария Powershell. Но он выдает ошибку BadRequest: RegionCapabilityNotAvailable, возможность региона недоступна для региона «Восточная часть США». Но восточная часть США является...
43 просмотров
schedule
12.09.2021
Как подключить AWS Athena к существующему хранилищу метастазов Hive
Мне нужно интегрировать сервис AWS Athena с существующим хранилищем метастазов Hive (не с AWS Glue).
Не могли бы вы сообщить мне, как я могу подключить Афину к Hive Metastore.
1516 просмотров
schedule
21.05.2022
Как использовать Hive Metastore отдельно?
Я установил и запустил сервер Metastore отдельно, без установки Hive. Однако я не могу найти документацию об API-интерфейсе бережливой сети для связи с сервером. Мне нужно иметь возможность подключаться к серверу Metastore напрямую или через...
844 просмотров
schedule
06.10.2022
Как справиться с потенциальной потерей данных при сравнении типов данных в разных группах
Предыстория. Наша группа проходит обновление Cloudera до 6.1.1, и мне было поручено определить, как справиться с потерей неявного преобразования типов данных между типами данных. См. Ссылку ниже для получения информации о соответствующих...
32 просмотров
schedule
03.10.2022
Как получить имя столбца и ввести его в куст
Я знаю о таких,
Чтобы получить имена столбцов в таблице, мы можем запустить:
show columns in <database>.<table_name>
Чтобы получить описание таблицы (включая имя_столбца, тип_столбца и многие другие данные):
describe...
22628 просмотров
schedule
03.01.2023
Hive 2.3.3 MetaException (сообщение: информация о версии не найдена в хранилище метаданных.)
У меня Hive 2.3.3 и Hadoop 3.1.0. Я могу запустить Hive с помощью команды hive на терминале, но когда я пытаюсь создать таблицу, я получаю следующую ошибку:
user$ hive
readlink: illegal option -- f
usage: readlink [-n] [file ...]
SLF4J: Class...
3997 просмотров
schedule
14.09.2023
Перенос существующих метаданных из хранилища метаданных (derby) и данных из Hive 1.2 в Hive 2.4.3
Я недавно развернул Hive 2.4.3, однако в более старой версии Hive 1.2 существует несколько таблиц с разделами, я использую Derby в качестве хранилища метаданных.
Как лучше всего перенести их на новую установку Hive?
18 просмотров
schedule
30.12.2022
Различные варианты метахранилища/каталога данных с Apache Spark?
Какие параметры хранилища метаданных/каталога данных я могу использовать с Apache Spark?
В простейшем случае я могу использовать Hive Metastore, который отлично работает с Hive, Spark и Presto. Есть ли какие-либо другие параметры каталога данных,...
704 просмотров
schedule
21.06.2023
Azure Databricks Высокий параллелизм + управление доступом к таблицам + внешнее хранилище метаданных улья + сквозной ADLS
Кластер с высоким уровнем параллелизма Databricks с внешним хранилищем метаданных куста + сквозной ADLS + контроль доступа к таблицам больше не поддерживается ????♂️
Любые мысли о том, как достичь нижеприведенной функциональности
Внешнее...
366 просмотров
schedule
13.07.2023
Тайм-аут раздела метахранилища Python Hive
У нас есть рабочие места ETL в Python (Luigi). Все они подключаются к Hive Metastore для получения информации о разделах.
Код:
from hive_metastore import ThriftHiveMetastore
client = ThriftHiveMetastore.Client(protocol)
partitions =...
81 просмотров
schedule
24.03.2023
Apache Spark 2.3.1 с хранилищем метаданных Hive 3.1.0
Мы обновили кластер HDP до версии 3.1.1.3.0.1.0-187 и обнаружили:
Spark не видит базы данных Hive
Похоже, это не реализованная функция Spark . Но единственный способ использовать Spark и Hive начиная с версии 3.0, который я нашел, - это...
5044 просмотров
schedule
06.01.2024
Hive Service JVM в Hive?
Я имею в виду Hadoop: полное руководство по Hive. Я узнал, что существует множество «Услуг Hive», которые он предоставляет, например: cli , hiveserver2 , beeline , metastore и т. д.
Вот фрагмент списка Hive Service (из той же книги):...
465 просмотров
schedule
21.01.2024