Groupby日期时间格式和总和与其他列熊猫中的值

问题描述

我一直在想如何将时间格式列分组并与另一列的值求和。

每隔4小时,我们就会获取信息(进入和退出),并希望进行分组,因此我们必须将所有条目加起来,然后每4小时退出一次。

问题是,如果我在下面应用代码,则会得到一个奇怪的结果。时间不再是每4小时一次,总和是完全错误的。有人知道问题出在哪里吗?

test = temp.groupby(['DATETIME'])['Entries_count'].sum().reset_index(name='Entries_count')

当我检查结果时。时间不再是每4小时一次,总和是完全错误的。有人知道问题出在哪里吗?

ps:时间格式=“%m /%d /%Y%H:%M:%S”

Table to process

result

解决方法

因此,在我的情况下,groupby函数在时间序列上不能很好地工作。 我没有使用groupby而是改用了重塑功能,在这种情况下更合适。 有关条目数不太可能发生的第二个问题是由于数据集中存在异常,在清理后可以提供更好的结果。

Distri = temp2.resample('4h').sum()

这解决了问题:)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...