如何在熊猫中进行滚动回归

问题描述

我有以下代码（它效率很高，因为它处于循环状态）。

from scipy.stats import linregress

results =[]

for pos in range(126,len(data)) :
        results.append(linregress(data.a.iloc[(pos-126):pos],data.b.iloc[(pos-126):pos])[0])

如何以更有效的形式重写此代码？可以滚动申请吗？

感谢一百万。

解决方法

所以我最终是循环执行此操作，而不是最佳解决方案。显然，这不是一个好的解决方案。

有更好的主意吗！

grouped = full_sample.groupby('ID')

df = pd.DataFrame()
for name,group in grouped:
    a=[]
    if len(group) > 126:
        for pos in range(126,len(group)) :
            a.append(linregress(group.x.iloc[(pos-126):pos],group.y.iloc[(pos-126):pos])[0])
        data= pd.DataFrame(a,index= (group.index.get_level_values(0).unique())[126:] ).assign(ID=name).set_index('ID',append=True)
df.append(data)

谢谢。

dataframe pandas pandas python scipy scipy