Redshift Spectrum由分区列组成的过滤

问题描述

以这种方式给出按日期划分的S3 Data-Lake:

year
|___month
    |___day
        |___file_*.json

我知道查询计划者受益于基于分区列的WHERE year = '2020' AND month = '08'之类的过滤器,通知它仅扫描特定月份的“文件夹”。

现在我的问题是,是否要以更复杂的方式表示过滤器:

...
WHERE (year + month + day)::date BETWEEN '2020-08-01' AND '2020-08-31'

Redshift Spectrum引擎仍然能够识别要访问8月的日分区吗?与前面的示例在性能上有实质性的区别吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)