问题描述
我有一个数据集,每个交易都有两个日期列。发票日期和收费日期。我正在尝试在 sql 中对表进行累积或运行总计。
数据表如下
InvoiceDate ChargeDate TransactionID
2021 年 1 月 1 日 2021 年 1 月 1 日 11111
2021 年 1 月 1 日 2021 年 1 月 1 日 55555
2021 年 1 月 1 日 2021 年 2 月 1 日 11111
2021 年 1 月 1 日 2021 年 1 月 1 日 22222
2021 年 1 月 1 日 2021 年 2 月 1 日 33333
2021 年 1 月 1 日 2021 年 2 月 1 日 44444
2021 年 2 月 1 日 2021 年 1 月 1 日 11111
2021 年 2 月 1 日 2021 年 1 月 1 日 22222
2021 年 2 月 1 日 2021 年 1 月 1 日 33333
2021 年 2 月 1 日 2021 年 1 月 1 日 44444
2021 年 2 月 1 日 2021 年 2 月 1 日 55555
我想要这种格式的输出
发票日期 ChargeDate 累计计数
2021 年 1 月 1 日 2021 年 1 月 1 日 2
2021 年 1 月 1 日 2021 年 2 月 1 日 5
二月/1/2021 一月/1/2021 3
2021 年 2 月 1 日 2021 年 2 月 1 日 4
我尝试了以下代码,但它没有给我一个运行总数。它给了我两列中每一列的总数
select
chargeDate,InvoiceDate,Count(distinct TransactionID) as CountofIDs
from mytable1
where InvoiceDate<=InvoiceDate
group by ChargeDate,InvoiceDate
解决方法
嗯。 . .如果我正确地遵循,您需要使用窗口函数进行聚合。
select invoicedate,chargedate,count(*) as cnt_on_dates,sum(count(*)) over (partition by invoicedate order by chargedate) as cumulative_count
from t
group by invoicedate,chargedate;