Я пытаюсь прочитать набор данных SVHN (http://ufldl.stanford.edu/housenumbers/) [полная версия]. Это hdf5, поэтому я попытался использовать h5py (так как pandas нужно время, чтобы его прочитать).
Таким образом, я попробовал метод, описанный в https://stackoverflow.com/a/41579641/1745291, но в моей системе ( Archlinux latest, h5py 2.8.0
, hdf5 1.10.2-3
, Intel (R) Core (TM) i7-7700 CPU @ 3.60GHz), это СУПЕР МЕДЛЕННО:> 30 секунд для чтения одного имени файла ...
Это ошибка в этой версии? Это ожидаемое время доступа? (в это трудно поверить, так как этот формат известен именно этим) ... Я что-то не так делаю?
... Примечание: я также нашел эту ветку без ответов: https://groups.google.com/forum/#!topic/h5py/4eHydpsQ1HU