python – PyTables批量获取和更新

我有每日库存数据作为使用PyTables创建的HDF5文件.我想获得一组行,将其作为一个数组处理,然后使用PyTables将其写回磁盘(更新行).我无法想办法干净利落地做到这一点.能不能让我知道最好的方法是什么？

我的数据：

Symbol,date,price,var1,var2
abcd,1,2.5,12,12.5
abcd,2,2.6,11,10.2
abcd,3,2.45,10.3
defg,12.34,19.1,18.1
defg,11.90,19.5,18.2
defg,11.75,21,20.9
defg,4,11.74,22.2,21.4

我想将与每个符号对应的行作为数组读取,进行一些处理并更新字段var1和var2.我事先知道所有的符号,所以我可以循环它们.我试过这样的事情：

rows_array = [row.fetch_all_fields() for row in table.where('Symbol == "abcd"')]

我想将rows_array传递给另一个函数,该函数将计算var1和var2的值并为每条记录更新它.请注意,var2与移动平均值类似,因此我无法在迭代器中计算它们,因此需要将整个行集合作为数组.

在使用rows_array计算我需要的任何内容后,我不确定如何将其写回数据,即使用新的计算值更新行.更新整个表时,我使用：

table.cols.var1[:] = calc_something(rows_array)

但是,当我只想更新表的一部分时,我不是最好的方法.我想我可以重新运行’where’条件,然后根据我的计算更新每一行,但这似乎是浪费时间重新扫描表.

您的建议值得赞赏……

谢谢,
-e

解决方法

如果我理解得很好,下一个应该做你想做的事：

condition = 'Symbol == "abcd"'
indices = table.getWhereList(condition)  # get indices
rows_array = table[indices]  # get values
new_rows = compute(rows_array)   # compute new values
table[indices] = new_rows  # update the indices with new values

希望这可以帮助

python – PyTables批量获取和更新

解决方法

相关文章