Разыменовывание объекта h5py очень медленно?

Я пытаюсь прочитать набор данных SVHN (http://ufldl.stanford.edu/housenumbers/) [полная версия]. Это hdf5, поэтому я попытался использовать h5py (так как pandas нужно время, чтобы его прочитать).

Таким образом, я попробовал метод, описанный в https://stackoverflow.com/a/41579641/1745291, но в моей системе ( Archlinux latest, h5py 2.8.0, hdf5 1.10.2-3, Intel (R) Core (TM) i7-7700 CPU @ 3.60GHz), это СУПЕР МЕДЛЕННО:> 30 секунд для чтения одного имени файла ...

Это ошибка в этой версии? Это ожидаемое время доступа? (в это трудно поверить, так как этот формат известен именно этим) ... Я что-то не так делаю?

... Примечание: я также нашел эту ветку без ответов: https://groups.google.com/forum/#!topic/h5py/4eHydpsQ1HU


person hl037_    schedule 12.08.2018    source источник
comment
Это очень большой файл, не правда ли?   -  person hpaulj    schedule 12.08.2018
comment
не так много, всего 228M (это digitStruct.mat из train.tar.gz)   -  person hl037_    schedule 12.08.2018