Ошибка при попытке создать внешнюю таблицу в улье

Я пытаюсь создать внешнюю таблицу, используя куст с помощью Hadoop, но почему-то это не удалось. Это ошибка, которую я получаю, когда пытаюсь выполнить свои запросы.

02:23:29.516 [HiveServer2-Background-Pool: Thread-39] ERROR hive.ql.exec.DDLTask - org.apache.hadoop.hive.ql.metadata.HiveException: Cannot validate serde: org.openx.data.jsonserde.JsonSerDe
        at org.apache.hadoop.hive.ql.exec.DDLTask.validateSerDe(DDLTask.java:3858)
        at org.apache.hadoop.hive.ql.plan.CreateTableDesc.toTable(CreateTableDesc.java:700)
        at org.apache.hadoop.hive.ql.exec.DDLTask.createTable(DDLTask.java:3960)
        at org.apache.hadoop.hive.ql.exec.DDLTask.execute(DDLTask.java:333)
        at org.apache.hadoop.hive.ql.exec.Task.executeTask(Task.java:197)
        at org.apache.hadoop.hive.ql.exec.TaskRunner.runSequential(TaskRunner.java:100)
        at org.apache.hadoop.hive.ql.Driver.launchTask(Driver.java:1858)
        at org.apache.hadoop.hive.ql.Driver.execute(Driver.java:1562)
        at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1313)
        at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1084)
        at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1077)
        at org.apache.hive.service.cli.operation.SQLOperation.runQuery(SQLOperation.java:235)
        at org.apache.hive.service.cli.operation.SQLOperation.access$300(SQLOperation.java:90)
        at org.apache.hive.service.cli.operation.SQLOperation$2$1.run(SQLOperation.java:299)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:422)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1926)
        at org.apache.hive.service.cli.operation.SQLOperation$2.run(SQLOperation.java:312)
        at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
        at java.util.concurrent.FutureTask.run(FutureTask.java:266)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
        at java.lang.Thread.run(Thread.java:748)
Caused by: java.lang.ClassNotFoundException: Class org.openx.data.jsonserde.JsonSerDe not found
        at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:2329)
        at org.apache.hadoop.hive.ql.exec.DDLTask.validateSerDe(DDLTask.java:3852)
        ... 22 more

Как я могу это решить?


person Lyn    schedule 26.11.2020    source источник
comment
не могли бы вы опубликовать свой скрипт CREATE TABLE?   -  person Koushik Roy    schedule 27.11.2020


Ответы (1)


Исключение говорит

java.lang.ClassNotFoundException: класс org.openx.data.jsonserde.JsonSerDe не найден

Установите JSONSerDe (загрузите JARS с http://www.congiu.net/hive-json-serde/ и поместите их в hive/lib), прочтите инструкции здесь: Hive-JSON- Серде

Также вместо того, чтобы помещать банки в улей/библиотеку, вы можете попробовать добавить банки в сеанс улья:

ADD JAR ADD JAR /usr/lib/hive/lib/json-serde-1.3.8-jar-with-dependencies.jar;
ADD JAR ADD JAR /usr/lib/hive/lib/json-udf-1.3.8-jar-with-dependencies.jar;

В качестве альтернативы вы можете попробовать собственный Hive JSONSerDe: org.apache.hive.hcatalog.data.JsonSerDe — просто измените имя класса в таблице DDL SerDe. Он должен быть уже установлен. Подробнее о различиях читайте здесь: https://docs.aws.amazon.com/athena/latest/ug/json-serde.html

person leftjoin    schedule 28.11.2020