填写缺少的日期值后的滚动平均值

问题描述

我有一个带有“日期”,“ countyFIPS”,“主题标签”和“得分列”的数据框。我想将“ Topic_label”中每个主题的每个县的数据汇总到3天。在日期列中缺少日期。我需要通过估算缺少的日期来获得持续时间日期列。对于每个日期,需要计算三天,包括该天该主题的滚动平均值。我们需要为每个主题收集三天的数据并取平均分数。

df=pd.DataFrame({'countyFIPS':[1001,1001,1002,1002],'Date':['2020-08-16','2020-08-14','2020-08-05','2020-08-07','2020-08-05'],'Topic_Label':['Health','Business','Health','Politics','Business'],'Score':[1,1,2,3,4,4]},)

所需的输出

df_desired=pd.DataFrame({'countyFIPS':[1001,'Date':['2020-08-14','2020-08-15','2020-08-16','2020-08-06','2020-08-07'],'Politics'],'3 day rolling average':[2.5,2.5,3.5,1.5,3.5]},)

谢谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)