Pandas read_hdf 给出“只能在表上使用迭代器或块大小”错误

问题描述

我有一个 h5 数据文件,其中包含键 rawreport

我可以读取 rawreport 并使用 read_hdf(filename,"rawreport") 保存为数据框,没有任何问题。但是数据有 1700 万行,我想使用分块

当我运行这段代码

chunksize = 10**6
someval = 100
df = pd.DataFrame()
for chunk in pd.read_hdf(filename,'rawreport',chunksize=chunksize,where='datetime < someval'):
    df = pd.concat([df,chunk],ignore_index=True)

我收到“类型错误:只能在表上使用迭代器或块大小”

rawreport 不是表格是什么意思,我该如何解决这个问题?我不是创建 h5 文件的人。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)