Допустим, у меня есть таблица:
db.table
Я загружаю таблицу, делаю с ней какие-то преобразования и, наконец, пытаюсь ее сохранить
mytable = LOAD 'db.table' USING HCatLoader();
.
.
-- My transforms
.
.
STORE mytable_final INTO 'db.table' USING HCatStorer();
Но код жалуется, что я пишу в таблицу с существующими данными.
Я просмотрел этот тикет JIRA, который кажется неактивным (я пытались использовать FORCE и OVERWRITE в нескольких местах команды STORE).
Я также просмотрел этот пост SO, но автор загружает из одного места и сохраняет в другом месте. Если я использую то, что есть в этом посте, результатом преобразования не будет данных. Удалить файлы не вариант. Я думаю о временном хранении файлов, но не знаю, лучший ли это вариант.
Я пытаюсь получить поведение, которое вы получаете в Hive, используя INSERT OVERWRITE.