python-将每周时间序列转换为每日(按比例标准)

我有一个表示每日产品需求的数据框.
由于该产品的需求是不规则的,因此先知模型的性能不佳,如下所示:

Daily

因此,我将其转换为每周时间序列,并且该模型更合适.

df.resample('W',how={'y': 'sum'}, 
                loffset=pd.offsets.timedelta(days=-6))

Weekly Model

我现在想做的是:

1-再次转换为每日,请注意以下每周的季节性:

Seasonality

工作日优先:

>星期六
>周二
>星期五
>星期一
>星期四
>星期三
>周日

因此,如果我对第一周的预测是需求等于3,我希望发生这种情况:

>星期六:1
>星期二:1
>星期五:1
>星期一:0
>星期四:0
>星期三:0
>周日:0

我的意思是,将每周的预测转换为尊重本周的每日顺序以分配值:

         ds      y
0   2018-01-07  5.0
1   2018-01-14  5.0
2   2018-01-21  4.0

预期结果:

         ds      y
0   2018-01-01  1
1   2018-01-02  1
2   2018-01-03  0 (Wednesday)
3   2018-01-04  1
4   2018-01-05  1
5   2018-01-06  1
6   2018-01-07  0 (Sunday)

解决方法:

由于您的数据是按日期编制索引的,所以我猜它不会那么长.因此,我们可以构造一个函数并应用:

def to_daily(val):
    # order of the day in a week
    order = np.argsort([5, 1, 4, 0, 3, 2, 6])

    b, r = val//7, val%7
    ret = np.array([b+1]*r + [b]*(7-r))

    return ret[order]

to_daily(5)
# array([1, 1, 0, 1, 1, 1, 0])

ret_df  = pd.DataFrame({'ds': pd.date_range(df.ds[0]-pd.to_timedelta('6d'),
                                 df.ds.values[-1], freq='d'),
                           'y' : np.array([to_daily(val) 
                                 for val in df.y.astype(int)]).flatten()})
ret_df

输出

    ds                     y
--  -------------------  ---
 0  2018-01-01 00:00:00    1
 1  2018-01-02 00:00:00    1
 2  2018-01-03 00:00:00    0
 3  2018-01-04 00:00:00    1
 4  2018-01-05 00:00:00    1
 5  2018-01-06 00:00:00    1
 6  2018-01-07 00:00:00    0
 7  2018-01-08 00:00:00    1
 8  2018-01-09 00:00:00    1
 9  2018-01-10 00:00:00    0
10  2018-01-11 00:00:00    0
11  2018-01-12 00:00:00    1
12  2018-01-13 00:00:00    1
13  2018-01-14 00:00:00    0
14  2018-01-15 00:00:00    1
15  2018-01-16 00:00:00    1
16  2018-01-17 00:00:00    1
17  2018-01-18 00:00:00    1
18  2018-01-19 00:00:00    1
19  2018-01-20 00:00:00    2
20  2018-01-21 00:00:00    1

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...