基于两个日期列创建多个df行

问题描述

我有一个由停电组成的df,其中包括几列,开始日期列和结束日期列

我想做些什么:

  1. 扫描“开始日期”列中最早的日期
  2. 扫描“完成日期”列中的最新日期
  3. 构建一个日期索引,其中所有日期都在这两个日期之间
  4. 对于每一行,为从开始日期到结束日期的每个日期创建一行,从而消除了对两个日期列的需求

所以如果我的df看起来如下:

start date    mw outage    end date     location
01/01/2000    1000         01/04/2000   merica
01/01/2000    2000         01/03/2000   canadia

我希望它看起来像这样

date        mw outage       location
01/01/2000  1000            merica
01/01/2000  2000            canadia
01/02/2000  1000            merica
01/02/2000  2000            canadia
01/03/2000  1000            merica
01/03/2000  2000            canadia
01/04/2000  1000            merica

我认为我可以使用重新索引来添加缺少的日期,但是我不确定如何识别最早/最新的日期,而且我不知道如何以这种方式创建行

解决方法

我们需要创建范围日期列,然后创建wikitables = read_html(page.text,attrs={"..."})

explode