Вопросы по теме 'impala'
Не удается запустить Impala после обновления CDH (5.0.0 - ›5.0.2)
Мне не удалось запустить импалу (сервер, магазин состояний, каталог) после обновления до cdh 5.0.2. Из того, что я обнаружил, сценарий запуска ожидает, что исполняемые файлы будут найдены в / usr / lib / impala / sbin. Такого каталога не было....
310 просмотров
schedule
01.12.2021
установить оболочку cloudera impala на mac os x и подключиться к кластеру импала
У нас есть сервер impala на prod, и мне нужно подключиться к нему с помощью оболочки impala из моего локального macbook с mac os x (10.8).
Я скачал Impala-cdh5.1.0-release.tar.gz , разархивировал его, попробовал buildall.sh , но безуспешно:...
1495 просмотров
schedule
22.09.2021
Создание панели управления Tableau с использованием Impala в качестве источника данных
У меня есть таблица imapla, которая содержит объемные записи (39885593), и мне нужно создать информационную панель, используя таблицу impala через Tableau.
Я пытался выполнить это требование несколькими способами, как показано ниже.
1) Извлечены...
641 просмотров
schedule
06.10.2021
group_by с Impala Ibis
У меня есть таблица Impala, которую я хотел бы запросить с помощью Ibis. Таблица выглядит следующим образом:
id | timestamp
-------------------
A | 5
A | 7
A | 3
B | 9
B | 5
Я хочу group_by изменить эту таблицу...
233 просмотров
schedule
30.10.2021
Вставка данных в Impala с R JDBC
Кто-нибудь знает, можно ли вставить всю таблицу (фрейм данных, матрицу, что угодно) в Impala, используя R с JDBC (или не с JDBC тогда)? Мы легко можем выбрать из Impala.
734 просмотров
schedule
04.09.2021
поддержка impala для массивов и карт
Я использую impala 2.3 из cdh 5.5.1
Насколько я понимаю, эта версия должна поддерживать массив и карты.
У меня есть таблица с полем массива (см. Ниже)
Когда я пытаюсь использовать CLI для получения этого поля, я получаю: Expr...
2859 просмотров
schedule
25.09.2021
Встроенная функция Impala: функция unix_timestamp недостаточно точна
Я использую следующий запрос impala для извлечения данных из my_table:
select id, timestamp, unix_timestamp(timestamp) as ts from my_table
Результат:
id timestamp ts...
350 просмотров
schedule
05.11.2021
раздвижное окно импала
Я хотел бы запустить функцию скользящего окна в impala, которая находит максимальную цену на основе 5-минутного интервала
другими словами, я хочу сравнить цену моей текущей строки со всеми строками за последние 5 минут и написать максимальную цену...
312 просмотров
schedule
09.09.2021
как записать вывод pyspark в таблицу импала?
Я использую pyspark для постановки задачи, здесь я предполагаю объединить свои результаты и передать их в качестве входных данных для другой моей модели. Но в hdfs мой вывод разбивается на части, и поэтому их сложно объединить.
Итак, я хотел...
460 просмотров
schedule
13.10.2021
Как использовать только что созданные столбцы для создания еще одного столбца в Impala?
Я пытаюсь понять, как создать столбец на основе других столбцов, которые я только что создал. Вот что я пытаюсь:
CREATE TABLE test AS
(SELECT
1 as column_1,
2 as column_2,
column_1 + column_2 as column_3
)
Но я получаю эту ошибку,...
2886 просмотров
schedule
07.11.2021
Запросы через месяцы и дни
Моя база данных журналов доступа хранит время как эпоху и извлекает год, месяц и день как целые числа. Кроме того, разбиение базы данных на разделы основано на извлеченных г / м / д, и у меня срок хранения составляет 35 дней.
Если я запустил этот...
78 просмотров
schedule
07.10.2021
Подключение к Impala из R без драйвера Impala JDBC
По неизвестной причине на моей Impala не установлен драйвер JDBC. Это затрудняет подключение R к Impala .
Я могу подключиться (и запросить) к оболочке Impala через Putty. Например.,
impala-shell --ssl -i some_name
Можно ли с помощью...
306 просмотров
schedule
19.09.2021
Как эффективно обновлять таблицы Impala, файлы которых изменяются очень часто
У нас есть решение на основе Hadoop (CDH 5.15), при котором мы получаем новые файлы в HDFS в некоторых каталогах. Поверх этих каталогов у нас есть 4-5 таблиц Impala (2.1). Процесс записи этих файлов в HDFS - это структурированная потоковая передача...
635 просмотров
schedule
21.09.2021
Легко переопределить базовые данные паркета для таблицы impala
У меня есть стол Impala, поддерживаемый паркетными файлами, который используется другой командой. Каждый день я запускаю пакетное задание Spark, которое перезаписывает существующие файлы паркета (при создании нового набора данных существующие файлы...
209 просмотров
schedule
07.11.2021
Попытка преобразовать строку в массив типа ‹string› в улье с помощью collect_set
У меня есть два столбца в моей таблице (дата, пользователи), которые являются строками.
date users
2019-01-01 '"U10000","U20000"'
Я пытаюсь преобразовать столбец users в array<string> и получаю \ в значениях....
85 просмотров
schedule
06.09.2021
Загрузка данных в пустую таблицу Impala с данными учетной записи, разделенными по коду города
Я пытаюсь скопировать данные из таблицы с именем account в пустую таблицу с именем accounts_by_area_code. У меня есть следующие поля в account_by_area_code: acct_num INT, first_name STRING, last_name STRING, phone_number STRING. Таблица разбита на...
126 просмотров
schedule
31.10.2021
как выбрать несколько столбцов из таблицы с помощью группы по (на основе одного столбца), наличия и подсчета в запросе улья
Требование: Использование группы по A и получение записей со счетом ›1 например:
SELECT count(sk), id, sk
FROM table x
GROUP BY id
HAVING COUNT(sk) > 1
Но я не могу выбрать sk в инструкции select. Есть ли другой способ сделать это. как...
29 просмотров
schedule
09.09.2021
Как использовать результаты запроса SELECT в предложении WHERE
Исходя из Teradata, я обычно создавал изменчивую таблицу с некоторыми переменными, которые я использовал во всем своем коде.
E.g.,
create volatile table var as (
select 'filter_value' as var_field
) with data on commit preserve rows;...
93 просмотров
schedule
20.02.2022
SQL-запрос для автоматического обновления даты
Я работаю над созданием приборной панели на Tableau. Для достижения наилучшего результата я сначала пишу код на SQL. Но мое требование - обновить дату между определенными датами. Например, в SQL я хочу отфильтровать диапазон дат, и он будет...
46 просмотров
schedule
22.02.2022
Создать таблицу из CSV со значениями, содержащими запятые, заключенные в кавычки
Я пытаюсь создать таблицу в Impala из CSV, который я загрузил в каталог HDFS. CSV содержит значения, заключенные в кавычки запятыми.
Пример:
1.66.96.0/19,"NTT Docomo,INC.","Ntt Docomo",9605,"NTT DOCOMO, INC."
1.66.128.0/17,"NTT...
9195 просмотров
schedule
03.03.2022