Я создал внешнюю таблицу Hive с указанной схемой, но без данных, скажем, таблицы A. Теперь предположим, что у меня есть файлы CSV в каталоге HDFS, организованные следующим образом:
20150718/dir1/dir2/file1.csv
20150718/dir1/dir2/file2.csv
...................
20150718/dir1/dir2/..../dirN/file10000.csv
Другими словами, файлы могут находиться в нескольких каталогах разных уровней в каталоге 20150718. Как загрузить эти CSV-файлы одной командой Hive / shell?
Еще одно замечание: я планирую создавать разделы на основе даты по мере того, как время идет, как мне тогда действовать? Все еще новый пользователь Hive, мы ценим совет.