问题描述
基本信息:Ollivander's Inventory from Hacker rank
有什么区别
SELECT code,power,MIN(coins_needed) AS coins_needed
FROM Wands
GROUP BY code,power
和
SELECT code,m.power,m.coins_needed
FROM (SELECT code,MIN(coins_needed) AS coins_needed
FROM Wands
GROUP BY code,power
) AS m JOIN
Wands AS w
ON m.code = w.code AND m.power = w.power AND
m.coins_needed = w.coins_needed
为什么我们需要加入原始表本身才能得到正确的结果? 我尝试使用 w3schools 中的 Product 表,它返回相同的结果,但数据顺序不同。
解决方法
显然,这两个查询看起来不同,可能会生成不同的执行计划。查询也不同。
最重要的区别是第一个查询为数据库中 code
和 power
的每个唯一组合返回一行。
如果有两行具有相同的最小值,则第二个查询将返回重复项。换句话说,它返回原始数据中对于每个 code
/power
组合具有最小硬币数量的所有行。
一个更细微的区别是如何处理 NULL
值。第一个查询返回 NULL
和 code
的 power
值。第二个过滤掉 NULL
值。
如果 code
和 power
没有 NULL
值并且如果 coins_needed
在具有相同 code
的行上是唯一的,这两个查询应该返回相同的结果和power
。然而,这些都是大假设,查询并不等效。
请注意,窗口函数是编写第二个查询的一种更简单的方法:
SELECT code,power,coins_needed
FROM (SELECT w.*,RANK() OVER (PARTITION BY code,power ORDER BY coins_needed) as seqnum
FROM Wands w
) w
WHERE seqnum = 1;
嗯,这不是 100% 等效,因为它包含 NULL
和 code
的 power
值。