Pandas 将每列与前 4 行聚合

问题描述

我有一个数据框:

df = Feat1  Feat2   Feat3
     1        3       2
     4        7       1
     6        1       6
     2        9       4
     5        8       5
     0        3       1

我想创建一个数据框,这样对于每一行 t > 4,每一列都是 t-1 + 0.75*t-2 + 0.5*t-3 + 0.25*t-4

所以对于这个 df 我将有:

df = Feat1  Feat2   Feat3
     1        3       2
     4        7       1
     6        1       6
     2        9       4
    8.75      14      9.5
   14.25      23      6.75

最好的方法是什么?

解决方法

递归计算不可矢量化,为了提高性能使用numba

from numba import jit

@jit(nopython=True)
def f(d):
    for t in range(4,d.shape[0]):
        d[t] = d[t-1] + 0.75*d[t-2] + 0.5*d[t-3] + 0.25*d[t-4]
    return d

df = pd.DataFrame(f(df.to_numpy().astype(float)),index=df.index,columns=df.columns)
print (df)
   Feat1  Feat2  Feat3
0   1.00    3.0   2.00
1   4.00    7.0   1.00
2   6.00    1.0   6.00
3   2.00    9.0   4.00
4   8.75   14.0   9.50
5  14.25   23.0  15.75