我在使用 NOT IN 对 PostgreSQL 数据库运行查询时遇到了一个奇怪的问题,但不明白为什么它不起作用

问题描述

我有一个带有 id 和 parent_id 列的分层表,parent_id 有一个指向 id 列的外键。每行只能有一个父级,但多行可以绑定到同一个父级。我想检索所有没有任何孩子的行。

我尝试使用以下查询进行此操作

SELECT *
FROM table
WHERE id NOT IN (
    SELECT disTINCT(parent_id)
    FROM table
)

这返回了 0 行。如果我将 NOT IN 更改为 IN,它会正确返回具有子级的行(其他行与它通过他们的 parent_id)

我最终得到了这个工作:

SELECT *
FROM table
WHERE id NOT IN(
    SELECT id
    FROM table
    WHERE id IN (
        SELECT disTINCT(parent_id)
        FROM table
    )
)

但我不明白为什么第一个查询不起作用?任何人都可以帮助我了解这里发生了什么吗?我不明白 NOT IN 应该如何工作?

解决方法

试试

SELECT *
FROM table
WHERE id NOT IN (
    SELECT DISTINCT(parent_id)
    FROM table
    WHERE parent_id IS NOT NULL
)

例如:

with t(x) as (values(1),(2))
select 3
where 3 not in (select x from t);

┌──────────┐
│ ?column? │
├──────────┤
│        3 │
└──────────┘

但是

with t(x) as (values(1),(2),(null))
select 3
where 3 not in (select x from t);

┌──────────┐
│ ?column? │
├──────────┤
└──────────┘

这是因为DBMS无法做出决定是id = null还是不是(结果是undefined

您可以按照上述方法或使用 not exists 修复它:

with t(x) as (values(1),(null))
select 3
where not exists (select x from t where x = 3);

┌──────────┐
│ ?column? │
├──────────┤
│        3 │
└──────────┘