PostgreSQL generate_series奇怪的行为

问题描述

以下两个查询产生的输出完全相同:

select
  ref_date::date
from generate_series('2020-10-01','2020-10-01'::date,interval '1 day') ref_date
--   ref_date
-- 2020-10-01

select now()::date ref_date
--   ref_date
-- 2020-10-01

但是,当在它们各自上运行explain时,我们会得到不同的结果:

# query 1
Function Scan on generate_series ref_date  (cost=0.01..12.51 rows=1000 width=4)

# query 2
Result  (cost=0.00..0.01 rows=1 width=4)

在基于ref_date的连接条件下,在连接序列中包括一个或多个连接时,情况会变得更糟:

select
  stuff
from (select ref_date::date from generate_series('2020-10-01',interval '1 day') ref_date) ref_date
left join (other_stuff) x on true
left join (more_stuff) y on y.id = x.id and y.timestamp < ref_date
-- executes in 10 minutes
-- EXPLAIN is long and complex
-- query uses index on more_stuff.(id) only
   despite an index on (id,timestamp) being available

select
  stuff
from (select now()::date ref_date) ref_date
left join (other_stuff) x on true
left join (more_stuff) y on y.id = x.id and y.timestamp < ref_date
-- executes in ten milliseconds
-- EXPLAIN is short and simple
-- query adequately uses index on more_stuff.(id,timestamp)

实际上我不能使用now()::date的原因是我需要generate_series()来生成多个日期(例如跨5年)。

问题

是否可以使用一种替代方法,该替代方法使用日期序列,并且与上述示例中使用now()::date时一样有效?

注意:

  • generate_series()方法的性能要比now()::date差得多,即使仅生成一个日期,
  • 将预先构造的表与generate_series的输出一起使用(而不是直接在查询中使用generate_series)会产生与直接使用该函数相同的结果,即使该表上有索引也是如此
  • 两个版本(now()和generate_series())的EXPLAIN ANALYZE输出都可以在这里找到:https://gist.github.com/JivanRoquet/a4f1c82ecf54b420844e652584317c76

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)