如何在SQL Hive中添加计数以对空值进行排名?

问题描述

这就是我现在拥有的:

| time  | car_id | order | in_order |
|-------|--------|-------|----------|
| 12:31 | 32     | null  | 0        |
| 12:33 | 32     | null  | 0        |
| 12:35 | 32     | null  | 0        |
| 12:37 | 32     | 123   | 1        |
| 12:38 | 32     | 123   | 1        |
| 12:39 | 32     | 123   | 1        |
| 12:41 | 32     | 123   | 1        |
| 12:43 | 32     | 123   | 1        |
| 12:45 | 32     | null  | 0        |
| 12:47 | 32     | null  | 0        |
| 12:49 | 32     | 321   | 1        |
| 12:51 | 32     | 321   | 1        |

我正在尝试对订单(包括具有空值的订单)进行排名,在这种情况下,按car_id排序。 这是我要寻找的结果:

| time  | car_id | order | in_order | row |
|-------|--------|-------|----------|-----|
| 12:31 | 32     | null  | 0        | 1   |
| 12:33 | 32     | null  | 0        | 1   |
| 12:35 | 32     | null  | 0        | 1   |
| 12:37 | 32     | 123   | 1        | 2   |
| 12:38 | 32     | 123   | 1        | 2   |
| 12:39 | 32     | 123   | 1        | 2   |
| 12:41 | 32     | 123   | 1        | 2   |
| 12:43 | 32     | 123   | 1        | 2   |
| 12:45 | 32     | null  | 0        | 3   |
| 12:47 | 32     | null  | 0        | 3   |
| 12:49 | 32     | 321   | 1        | 4   |
| 12:51 | 32     | 321   | 1        | 4   |

我只是不知道如何管理空值的计数。 谢谢!

解决方法

您可以在每行之前计算非NULL值的数量,然后使用dense_rank()

select t.*,dense_rank() over (partition by car_id order by grp) as row
from (select t.*,count(order) over (partition by car_id order by time) as grp
      from t
     ) t;