问题描述
以这种方式给出按日期划分的S3 Data-Lake:
year
|___month
|___day
|___file_*.json
我知道查询计划者受益于基于分区列的WHERE year = '2020' AND month = '08'
之类的过滤器,通知它仅扫描特定月份的“文件夹”。
现在我的问题是,是否要以更复杂的方式表示过滤器:
...
WHERE (year + month + day)::date BETWEEN '2020-08-01' AND '2020-08-31'
Redshift Spectrum引擎仍然能够识别要访问8月的日分区吗?与前面的示例在性能上有实质性的区别吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)