问题描述
我有一个形状为 70x10,000,000(10,000 列 70 行)的 matlab 文件 令人讨厌的是,当我运行这行应该打印那块数据的代码时,
f = h5py.File(filepath,'r')
item = list(f.items())[0][1]
print(item)
它将其重塑为 10,000x70(10,000 行,70 列) 有没有办法保持原来的形状?
解决方法
h5py 将 HDF5 数据作为 Numpy 数组返回。因此,使用 h5py 的关键是在需要时使用 Numpy 方法。您可以使用 np.transpose()
轻松转置数组。下面提供了一个简单的例子。它创建了一个包含 2 个数据集的 HDF5 文件:1) 形状为 (20,5) 的数组,以及 2) 形状为 (5,20) 的转置数组。然后它提取 2 个数组并使用 np.transpose()
切换行/列顺序。
with h5py.File('SO_67031436','w') as h5w:
arr = np.arange(100.).reshape(20,5)
h5w.create_dataset('ds_1',data=arr)
h5w.create_dataset('ds_1t',data=np.transpose(arr))
with h5py.File('SO_67031436','r') as h5r:
for name in h5r:
print(name,',shape=',h5r[name].shape)
arr=np.transpose(h5r[name][:])
print('transposed shape=',arr.shape)