具有自适应窗口大小的移动平均

问题描述

我有一个包含两列 dfx 的 DataFrame y,我想将其绘制为线图,如下所示:

import matplotlib.pyplot as plt
import seaborn as sns 
fig = plt.figure(figsize=(9,7))
ax = plt.subplot(111)   
df = df.groupby(x,as_index=False).mean()
df = df.sort_values(x)
df[y] = df[y].rolling(1000).mean()
df = df.dropna()
sns.lineplot(data=df,x=x,y=y)
plt.tight_layout()

结果图如下所示:

enter image description here

可以看出,有更多的数据点具有较低的 x 值,即随着 x 值的增加,数据点越来越少。因此,使用固定窗口大小为 1000 的滚动平均值会为大 x 值平均太多数据点,而为低 x 值平均太少数据点。

是否有可能使滚动平均值的窗口随着 x 值的增大而减小或适应数据点的数量?或者对于这种数据,是否存在比滚动平均更好的方法

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)