问题描述
我有一个每小时收集一次股票期权数据的数据集。不幸的是,由于某些维护等原因,缺少某些日期和时间。
这里有一个带有数据框(日期_,价格)的示例,您可以看到“ 2018-02-08”这一天,我们只有2小时,而不是24小时。
是否可以找到丢失的日期?并用缺少的日期填充数据集(在其他列中添加NA)?
我尝试了这种方法来查找缺少的日期
pd.date_range(df.Date_.min(),df.Date_.max()).difference(df.Date_)
但是这在小时数方面效果不佳,因为它今天凌晨6点只返回了1个小时。
解决方法
使用重采样有效
apply(lambda x:x.set_index('Date _')。resample('H')