即使我的索引不是日期时间，pandas 也会滚动启用偏移量

问题描述

对于这个数据框

df = pd.DataFrame({'B': [0,1,2,np.nan,4]},index=[0.1,0.2,0.5,0.7,0.9])

       B
0.1  0.0
0.2  1.0
0.5  2.0
0.7  NaN
0.9  4.0

我想执行基于偏移的滚动，例如：

df.rolling(0.3).sum()

但是我收到了这个错误：

ValueError: window 必须是整数

有人可以帮我吗？我的真实案例涉及大约 1B 行，最后我需要执行 groupby().rolling()。以上只是我的问题的极端简化。请帮我。谢谢！

最佳答案感谢 GitHub 中的 mroeschke：

In [1]: df = pd.DataFrame({'B': [0,0.9])

In [2]: df.index = pd.to_datetime(df.index,unit="s")

In [3]: df.rolling("300ms").mean()
Out[3]:
                           B
1970-01-01 00:00:00.100  0.0
1970-01-01 00:00:00.200  0.5
1970-01-01 00:00:00.500  2.0
1970-01-01 00:00:00.700  2.0
1970-01-01 00:00:00.900  4.0

解决方法

最佳答案感谢 GitHub 中的 mroeschke：

In [1]: df = pd.DataFrame({'B': [0,1,2,np.nan,4]},index=[0.1,0.2,0.5,0.7,0.9])

In [2]: df.index = pd.to_datetime(df.index,unit="s")

In [3]: df.rolling("300ms").mean()
Out[3]:
                           B
1970-01-01 00:00:00.100  0.0
1970-01-01 00:00:00.200  0.5
1970-01-01 00:00:00.500  2.0
1970-01-01 00:00:00.700  2.0
1970-01-01 00:00:00.900  4.0

pandas pandas python

即使我的索引不是日期时间，pandas 也会滚动启用偏移量

问题描述

解决方法

相关问答