Вопросы по теме 'impala'

Не удается запустить Impala после обновления CDH (5.0.0 - ›5.0.2)
Мне не удалось запустить импалу (сервер, магазин состояний, каталог) после обновления до cdh 5.0.2. Из того, что я обнаружил, сценарий запуска ожидает, что исполняемые файлы будут найдены в / usr / lib / impala / sbin. Такого каталога не было....
310 просмотров
schedule 01.12.2021

установить оболочку cloudera impala на mac os x и подключиться к кластеру импала
У нас есть сервер impala на prod, и мне нужно подключиться к нему с помощью оболочки impala из моего локального macbook с mac os x (10.8). Я скачал Impala-cdh5.1.0-release.tar.gz , разархивировал его, попробовал buildall.sh , но безуспешно:...
1495 просмотров
schedule 22.09.2021

Создание панели управления Tableau с использованием Impala в качестве источника данных
У меня есть таблица imapla, которая содержит объемные записи (39885593), и мне нужно создать информационную панель, используя таблицу impala через Tableau. Я пытался выполнить это требование несколькими способами, как показано ниже. 1) Извлечены...
641 просмотров
schedule 06.10.2021

group_by с Impala Ibis
У меня есть таблица Impala, которую я хотел бы запросить с помощью Ibis. Таблица выглядит следующим образом: id | timestamp ------------------- A | 5 A | 7 A | 3 B | 9 B | 5 Я хочу group_by изменить эту таблицу...
233 просмотров
schedule 30.10.2021

Вставка данных в Impala с R JDBC
Кто-нибудь знает, можно ли вставить всю таблицу (фрейм данных, матрицу, что угодно) в Impala, используя R с JDBC (или не с JDBC тогда)? Мы легко можем выбрать из Impala.
734 просмотров
schedule 04.09.2021

поддержка impala для массивов и карт
Я использую impala 2.3 из cdh 5.5.1 Насколько я понимаю, эта версия должна поддерживать массив и карты. У меня есть таблица с полем массива (см. Ниже) Когда я пытаюсь использовать CLI для получения этого поля, я получаю: Expr...
2859 просмотров
schedule 25.09.2021

Встроенная функция Impala: функция unix_timestamp недостаточно точна
Я использую следующий запрос impala для извлечения данных из my_table: select id, timestamp, unix_timestamp(timestamp) as ts from my_table Результат: id timestamp ts...
350 просмотров
schedule 05.11.2021

раздвижное окно импала
Я хотел бы запустить функцию скользящего окна в impala, которая находит максимальную цену на основе 5-минутного интервала другими словами, я хочу сравнить цену моей текущей строки со всеми строками за последние 5 минут и написать максимальную цену...
312 просмотров

как записать вывод pyspark в таблицу импала?
Я использую pyspark для постановки задачи, здесь я предполагаю объединить свои результаты и передать их в качестве входных данных для другой моей модели. Но в hdfs мой вывод разбивается на части, и поэтому их сложно объединить. Итак, я хотел...
460 просмотров
schedule 13.10.2021

Как использовать только что созданные столбцы для создания еще одного столбца в Impala?
Я пытаюсь понять, как создать столбец на основе других столбцов, которые я только что создал. Вот что я пытаюсь: CREATE TABLE test AS (SELECT 1 as column_1, 2 as column_2, column_1 + column_2 as column_3 ) Но я получаю эту ошибку,...
2886 просмотров
schedule 07.11.2021

Запросы через месяцы и дни
Моя база данных журналов доступа хранит время как эпоху и извлекает год, месяц и день как целые числа. Кроме того, разбиение базы данных на разделы основано на извлеченных г / м / д, и у меня срок хранения составляет 35 дней. Если я запустил этот...
78 просмотров
schedule 07.10.2021

Подключение к Impala из R без драйвера Impala JDBC
По неизвестной причине на моей Impala не установлен драйвер JDBC. Это затрудняет подключение R к Impala . Я могу подключиться (и запросить) к оболочке Impala через Putty. Например., impala-shell --ssl -i some_name Можно ли с помощью...
306 просмотров
schedule 19.09.2021

Как эффективно обновлять таблицы Impala, файлы которых изменяются очень часто
У нас есть решение на основе Hadoop (CDH 5.15), при котором мы получаем новые файлы в HDFS в некоторых каталогах. Поверх этих каталогов у нас есть 4-5 таблиц Impala (2.1). Процесс записи этих файлов в HDFS - это структурированная потоковая передача...
635 просмотров

Легко переопределить базовые данные паркета для таблицы impala
У меня есть стол Impala, поддерживаемый паркетными файлами, который используется другой командой. Каждый день я запускаю пакетное задание Spark, которое перезаписывает существующие файлы паркета (при создании нового набора данных существующие файлы...
209 просмотров
schedule 07.11.2021

Попытка преобразовать строку в массив типа ‹string› в улье с помощью collect_set
У меня есть два столбца в моей таблице (дата, пользователи), которые являются строками. date users 2019-01-01 '"U10000","U20000"' Я пытаюсь преобразовать столбец users в array<string> и получаю \ в значениях....
85 просмотров
schedule 06.09.2021

Загрузка данных в пустую таблицу Impala с данными учетной записи, разделенными по коду города
Я пытаюсь скопировать данные из таблицы с именем account в пустую таблицу с именем accounts_by_area_code. У меня есть следующие поля в account_by_area_code: acct_num INT, first_name STRING, last_name STRING, phone_number STRING. Таблица разбита на...
126 просмотров
schedule 31.10.2021

как выбрать несколько столбцов из таблицы с помощью группы по (на основе одного столбца), наличия и подсчета в запросе улья
Требование: Использование группы по A и получение записей со счетом ›1 например: SELECT count(sk), id, sk FROM table x GROUP BY id HAVING COUNT(sk) > 1 Но я не могу выбрать sk в инструкции select. Есть ли другой способ сделать это. как...
29 просмотров
schedule 09.09.2021

Как использовать результаты запроса SELECT в предложении WHERE
Исходя из Teradata, я обычно создавал изменчивую таблицу с некоторыми переменными, которые я использовал во всем своем коде. E.g., create volatile table var as ( select 'filter_value' as var_field ) with data on commit preserve rows;...
93 просмотров
schedule 20.02.2022

SQL-запрос для автоматического обновления даты
Я работаю над созданием приборной панели на Tableau. Для достижения наилучшего результата я сначала пишу код на SQL. Но мое требование - обновить дату между определенными датами. Например, в SQL я хочу отфильтровать диапазон дат, и он будет...
46 просмотров
schedule 22.02.2022

Создать таблицу из CSV со значениями, содержащими запятые, заключенные в кавычки
Я пытаюсь создать таблицу в Impala из CSV, который я загрузил в каталог HDFS. CSV содержит значения, заключенные в кавычки запятыми. Пример: 1.66.96.0/19,"NTT Docomo,INC.","Ntt Docomo",9605,"NTT DOCOMO, INC." 1.66.128.0/17,"NTT...
9195 просмотров
schedule 03.03.2022