Как мы все знаем, HDFS - это, по сути, система объектного хранения, в которой данные, однажды записанные в нее, не могут быть обновлены, но весь файл должен быть перезаписан целиком. Если это так, то в чем необходимость введения формата ORC в HDFS, который позволяет нам изменять / обновлять данные, хранящиеся в таблицах кустов, базовой системой хранения которых является HDFS.
Это делает HDFS блочным хранилищем, в котором данные могут быть обновлены / изменены, что противоречит всей структуре Hadoop.