问题描述
df = Feat1 Feat2 Feat3
1 3 2
4 7 1
6 1 6
2 9 4
5 8 5
0 3 1
我想创建一个数据框,这样对于每一行 t > 4,每一列都是 t-1 + 0.75*t-2 + 0.5*t-3 + 0.25*t-4
所以对于这个 df 我将有:
df = Feat1 Feat2 Feat3
1 3 2
4 7 1
6 1 6
2 9 4
8.75 14 9.5
14.25 23 6.75
最好的方法是什么?
解决方法
递归计算不可矢量化,为了提高性能使用numba:
from numba import jit
@jit(nopython=True)
def f(d):
for t in range(4,d.shape[0]):
d[t] = d[t-1] + 0.75*d[t-2] + 0.5*d[t-3] + 0.25*d[t-4]
return d
df = pd.DataFrame(f(df.to_numpy().astype(float)),index=df.index,columns=df.columns)
print (df)
Feat1 Feat2 Feat3
0 1.00 3.0 2.00
1 4.00 7.0 1.00
2 6.00 1.0 6.00
3 2.00 9.0 4.00
4 8.75 14.0 9.50
5 14.25 23.0 15.75