问题描述
我有一个使用group by的超级简单查询,但我不知道如何获得所需的结果。这实际上是使用min()和max()的简单查询。我有一个表,其中资产属于具有日期输入/输出日期的某个位置(它也具有多个输入/输出日期,而没有更改位置),但是如果资产移回到其先前已存在的位置,则分组不会工作。我尝试使用over(partition by ...)的组合,只是解决不了。
表格:
Asset Location Date In Date Out
------------------------------------------
00001 A 01/01/2020 13/01/2020
00001 A 14/01/2020 26/01/2020
00001 A 27/01/2020 08/02/2020
00001 B 09/02/2020 21/02/2020
00001 B 22/02/2020 05/03/2020
00001 B 06/03/2020 18/03/2020
00001 A 19/03/2020 31/03/2020
00001 A 01/04/2020 13/04/2020
00001 A 14/04/2020 26/04/2020
00001 A 27/04/2020 09/05/2020
00001 A 10/05/2020 16/09/2020
所需结果:
Asset Location Date In Date Out
------------------------------------------
00001 A 01/01/2020 08/02/2020
00001 B 09/02/2020 18/03/2020
00001 A 19/03/2020 16/09/2020
实际结果:
Asset Location Date In Date Out
------------------------------------------
00001 A 01/01/2020 16/09/2020
00001 B 09/02/2020 18/03/2020
解决方法
这是一个群岛问题。一个简单的解决方案是行号的不同:
select asset,location,min(date_in),max(date_out)
from (select t.*,row_number() over (partition by asset order by date_in) as seqnum
row_number() over (partition by asset,location order by date_in) as seqnum_2
from t
) t
group by asset,(seqnum - seqnum_2);
为什么行之有效的解释起来有些棘手。如果您查看子查询,将会看到行号的差异如何定义所需的连续行。