问题描述
我有一个函数,可以保存多个对象的当前状态并将其写入表中,如下所示:
ObjectId StatusId Date 1 10 2020-04-04 00:00:00.000 2 10 2020-04-04 00:00:00.000 1 11 2020-04-05 00:00:00.000 2 10 2020-04-05 00:00:00.000 1 10 2020-04-06 00:00:00.000 2 10 2020-04-06 00:00:00.000
我想让它成为一个由ObjectId和StatusId分组的间隔。 因此,对于上述情况,首选输出将如下所示:
ObjectId StatusId StartDate EndDate 1 10 2020-04-04 00:00:00.000 2020-04-04 00:00:00.000 1 11 2020-04-05 00:00:00.000 2020-04-05 00:00:00.000 1 10 2020-04-06 00:00:00.000 2020-04-06 00:00:00.000 2 10 2020-04-04 00:00:00.000 2020-04-06 00:00:00.000
请注意,一个对象可以在多种情况下具有相同的状态,但是如果其状态不同,则需要将其置于单独的间隔中。因此,在我的情况下,简单的group by和max(Date)无效。 预先感谢。
解决方法
这是一种差距与孤岛的形式。为此,行号的不同可能是最简单的方法:
select objectid,status,min(date),max(date)
from (select t.*,row_number() over (partition by objectid order by date) as seqnum,row_number() over (partition by objectid,status order by date) as seqnum_2
from t
) t
group by objectid,(seqnum - seqnum_2);
为什么这个工作有点麻烦解释。但是,如果您查看子查询的结果,则会看到要识别的组之间的差异是如何恒定的。