问题描述
我有这个查询:
total_cost
结果是:
SHOW PARTITIONS tablename;
我有 5 个分区还是 1 个分区,作为日期?什么计入 athena 的 20,000 分区限制。 5 还是 1?
解决方法
我会说“它按日期分区,有 5 个分区”,因为 ADD PARTITION
用于添加单个目录。因此,它可能会达到 5 到 20,000 的限制。
如果您经常在查询中使用 WHERE DT = '2018-xx-xx'
语句,则分区很有用,但在其他情况下不会特别有用。 (将数据拆分为多个文件确实有助于并行化工作,但也会带来开销。)