Мне нужно интегрировать сервис AWS Athena с существующим хранилищем метастазов Hive (не с AWS Glue).
Не могли бы вы сообщить мне, как я могу подключить Афину к Hive Metastore.
Мне нужно интегрировать сервис AWS Athena с существующим хранилищем метастазов Hive (не с AWS Glue).
Не могли бы вы сообщить мне, как я могу подключить Афину к Hive Metastore.
Athena работает только со своим собственным хранилищем метаданных или связанным хранилищем метаданных AWS Glue. Это не будет работать с внешним хранилищем метаданных.
Однако вы можете настроить несколько таблиц или баз данных в одном и том же базовом хранилище S3. Поэтому, если вы записывали данные в S3 с помощью внешнего хранилища метаданных, вы могли запрашивать эти файлы с помощью Athena после настройки соответствующей базы данных и определения таблицы в хранилище метаданных Athena.
Другой способ - экспортировать метаданные улья в файл с помощью команды
command = "hive -f" + schema + "_ tables.hql -S >>" + schema + ". output"
где schema = для экспорта и импорта определений таблиц в Athena, используя groovy в python.
Инструкцию по настройке groovy можно найти по ссылке
Amazon Athena только что выпустила новую функцию (сейчас в предварительной версии), которая позволяет подключать Athena к вашему хранилищу Apache Hive Metastore. Вы можете увидеть объявление здесь. Подробные инструкции по добавлению коннектора Hive Metastore доступны в Athena документация.