填充缺少日期的数据集以小时为单位

问题描述

我有一个每小时收集一次股票期权数据的数据集。不幸的是,由于某些维护等原因,缺少某些日期和时间。

这里有一个带有数据框(日期_,价格)的示例,您可以看到“ 2018-02-08”这一天,我们只有2小时,而不是24小时。

enter image description here

是否可以找到丢失的日期?并用缺少的日期填充数据集(在其他列中添加NA)?

我尝试了这种方法来查找缺少的日期

pd.date_range(df.Date_.min(),df.Date_.max()).difference(df.Date_)

但是这在小时数方面效果不佳,因为它今天凌晨6点只返回了1个小时。

enter image description here

解决方法

使用重采样有效

apply(lambda x:x.set_index('Date _')。resample('H')

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...