Внутренняя организация данных HDF5 и использование NumPy

как говорится в документации hdf5, HDF5 хранит данные с помощью NumPy

"Он построен на основе библиотеки HDF5, языка Python и пакета NumPy. Он имеет объектно-ориентированный интерфейс, который в сочетании с расширениями C для критически важных частей кода делает его быстрым и в то же время быстрым. чрезвычайно простой в использовании инструмент для интерактивного хранения и извлечения очень больших объемов данных"

...

"PyTables использует эти контейнеры NumPy в качестве буферов в памяти, чтобы увеличить пропускную способность ввода-вывода до пределов платформы."

Так каков механизм? Как PyTables использует NumPy? В конце концов, они генерируют простой hdf5, доступный из других языков...


person illegal-immigrant    schedule 09.11.2010    source источник


Ответы (1)


HDF5 — это библиотека языка C. HDF5 хранит числа, включая числа с плавающей запятой, независимо от платформы (прокрутите вниз до таблицы «Примеры собственных типов данных и соответствующих типов C», дополнительную информацию можно найти в Руководстве пользователя).

PyTables просто преобразует тип данных HDF5 в тип данных NumPy. И он смешивает код Python и собственный код, чтобы уменьшить накладные расходы ввода-вывода.

person Max Lybbert    schedule 09.11.2010