即使我的索引不是日期时间,pandas 也会滚动启用偏移量

问题描述

对于这个数据框

df = pd.DataFrame({'B': [0,1,2,np.nan,4]},index=[0.1,0.2,0.5,0.7,0.9])

df

       B
0.1  0.0
0.2  1.0
0.5  2.0
0.7  NaN
0.9  4.0

我想执行基于偏移的滚动,例如:

df.rolling(0.3).sum()

但是我收到了这个错误

ValueError: window 必须是整数

有人可以帮我吗?我的真实案例涉及大约 1B 行,最后我需要执行 groupby().rolling()。以上只是我的问题的极端简化。请帮我。谢谢!

最佳答案感谢 GitHub 中的 mroeschke:

In [1]: df = pd.DataFrame({'B': [0,0.9])

In [2]: df.index = pd.to_datetime(df.index,unit="s")

In [3]: df.rolling("300ms").mean()
Out[3]:
                           B
1970-01-01 00:00:00.100  0.0
1970-01-01 00:00:00.200  0.5
1970-01-01 00:00:00.500  2.0
1970-01-01 00:00:00.700  2.0
1970-01-01 00:00:00.900  4.0

解决方法

最佳答案感谢 GitHub 中的 mroeschke:

In [1]: df = pd.DataFrame({'B': [0,1,2,np.nan,4]},index=[0.1,0.2,0.5,0.7,0.9])

In [2]: df.index = pd.to_datetime(df.index,unit="s")

In [3]: df.rolling("300ms").mean()
Out[3]:
                           B
1970-01-01 00:00:00.100  0.0
1970-01-01 00:00:00.200  0.5
1970-01-01 00:00:00.500  2.0
1970-01-01 00:00:00.700  2.0
1970-01-01 00:00:00.900  4.0

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...