问题描述
我有一个带有business_time
PERIOD
的临时DB2表,如下所示:
id local_unit vehicle start end
12389 3538 21147 2019-01-01 2019-07-01
12389 3538 21147 2019-07-01 2019-12-31
我想修改表并合并上面的行,其中所有值都相同且business_time周期相邻。结果应如下所示:
id local_unit vehicle start end
12389 3538 21147 2019-01-01 2019-12-31
解决方案还必须考虑到数据中可能存在不不相邻的时间段,这些时间段不应合并。性能不是问题,因为这将是一个批处理作业,每年只运行几次。
解决方法
这是一个鸿沟和孤岛的问题。如前所述,您可以使用lag()
和累计金额:
select id,local_unit,vehicle,min(start),max(end)
from (select t.*,sum(case when prev_end >= start then 0 else 1 end) over
(partition by id,vehicle order by start) as grp
from (select t.*,lag(end) over (partition by id,vehicle order by start) as prev_end
from t
) t
) t
group by id,grp;
lag()
查找上一个结束时间。 sum()
正在计算不重叠的次数-这是“岛”的开始。最终的逻辑只是汇总值。