Почему в журнале всегда отображается сообщение Нет доступных данных при построении куба?

В случае sample на официальном сайте Kylin, когда я собирал cube, на первом шаге Create Intermediate Flat Hive Table лог всегда No Data Available, статус всегда running.

Сборка куба выполнялась более трех часов.

Я проверил таблицу базы данных куста kylin_sales, и в таблице есть данные.

И я обнаружил, что промежуточная плоская таблица улья kylin_intermediate_kylin_sales_cube_402e3eaa_dfb2_7e3e_04f3_07248c04c10c успешно создана в улье, но в ней нет данных.

hive> show tables;
OK
...
kylin_intermediate_kylin_sales_cube_402e3eaa_dfb2_7e3e_04f3_07248c04c10c
kylin_sales
...
Time taken: 9.816 seconds, Fetched: 10000 row(s)

hive> select * from kylin_sales;
OK
...
8992    2012-04-17  ABIN    15687   0   13  95.5336 17  10000975    10000507    ADMIN   Shanghai
8993    2013-02-02  FP-non GTC  67698   0   13  85.7528 6   10000856    10004882    MODELER Hongkong
...
Time taken: 3.759 seconds, Fetched: 10000 row(s)

Среда развертывания выглядит следующим образом:

  1. зоопарк-3.4.14
  2. хауп-3.2.0
  3. hbase-1.4.9
  4. Apache-улей-2.3.4-бен
  5. апач-килин-2.6.1-бин-hbase1x
  6. опенсш5.3
  7. jdk1.8.0_144

Я развернул кластер через докер и создал 3 контейнера, один мастер, два слейва.

Выполняется Create Intermediate Flat Hive Table шаг.


person sharon    schedule 28.04.2019    source источник
comment
Кто-нибудь сталкивался с такой же проблемой, как я?   -  person sharon    schedule 29.04.2019


Ответы (1)


No Data Available означает, что журнал этого шага не был захвачен Kylin. Обычно только при выходе из шага (успешно или неудачно) журнал будет записан, после чего вы увидите данные.

В этом случае, как правило, это указывает на то, что задание ожидает Hive по многим причинам. Самый простой способ - посмотреть журнал Kylin, вы увидите Hive CMD, который выполняет Kylin, а затем вы можете запустить его вручную в консоли, тогда вы воспроизведете проблему. Пожалуйста, проверьте, достаточно ли ресурсов вашего Hive/Hadoop (процессор, память) для выполнения такого запроса.

person ShaoFeng Shi    schedule 30.04.2019
comment
Вы можете найти CMD, быстро выполнив поиск Создать и распространить таблицу, cmd: в журналах/kylin.log - person ShaoFeng Shi; 30.04.2019
comment
Спасибо за ваш ответ! Я искал Создать и распространить таблицу, cmd: в logs/kylin.log, но в журнале нет сообщения об ошибке, и таблица была успешно создана. Кроме того, я обнаружил, что когда я загружаю таблицу на странице kylin, я установил флажок «Вычислить мощность столбца», но мощность каждого столбца таблицы Hive пуста. Память: 32 ГБ ЦП: 8 ядер, 2,50 ГГц - person sharon; 30.04.2019