问题描述
我一直在想如何将时间格式列分组并与另一列的值求和。
每隔4小时,我们就会获取信息(进入和退出),并希望进行分组,因此我们必须将所有条目加起来,然后每4小时退出一次。
问题是,如果我在下面应用代码,则会得到一个奇怪的结果。时间不再是每4小时一次,总和是完全错误的。有人知道问题出在哪里吗?
test = temp.groupby(['DATETIME'])['Entries_count'].sum().reset_index(name='Entries_count')
当我检查结果时。时间不再是每4小时一次,总和是完全错误的。有人知道问题出在哪里吗?
ps:时间格式=“%m /%d /%Y%H:%M:%S”
解决方法
因此,在我的情况下,groupby函数在时间序列上不能很好地工作。 我没有使用groupby而是改用了重塑功能,在这种情况下更合适。 有关条目数不太可能发生的第二个问题是由于数据集中存在异常,在清理后可以提供更好的结果。
Distri = temp2.resample('4h').sum()
这解决了问题:)