У меня есть несжатый файл HDF5 размером 460 МБ. Я использую h5repack для сохранения файла со сжатыми фрагментами, например:
h5repack -v -l CHUNK=128x128x1 -f GZIP=1 file.h5 file_chunked.h5
Это прекрасно работает, и размер полученного файла составляет около 1/3 от исходного (170 МБ).
Однако, если я попытаюсь использовать разбиение на фрагменты без сжатия, как это
h5repack -v -l CHUNK=128x128x1 -f NONE file.h5 file_chunked.h5
или даже
h5repack -v -l CHUNK=128x128x1 file.h5 file_chunked.h5
то размер полученного файла значительно больше (в 10 раз) исходного (3,9 ГБ).
Размеры, типы данных и содержимое результирующих наборов данных кажутся одинаковыми. Когда я просматриваю файл в HDFView, я не вижу никакой разницы с исходным, за исключением того, что Chunking установлен на 128x128x1.
Я ожидаю, что фрагментированный, но несжатый файл будет примерно того же размера, что и оригинал.
Может кто-то объяснить это мне? Я, вероятно, упускаю здесь что-то фундаментальное.
Огромное спасибо!