问题描述
我有一个应用程序,我必须每天加载 3 组增量数据,每次运行的批次计数约为 3000 万条记录。所以我担心我的 CCI 压缩质量。请注意,我的表也按月按日期列进行分区。
在每批中,我将有 >20% 的更新和 >40% 的插入。所以我的 CCI 构建质量受到严重影响。我想避免每次运行后的重建/重组时间。
我目前的策略是使用临时表并将该数据更改到我的主表中。为此,我需要确定每次增量后将选择的最大 row_group 大小。
你能告诉我在跑步前我如何才能弄清楚吗?或者有什么方法可以修复 row_group 的最小大小?
注意:我也很欣赏您可能拥有的任何其他策略。另外,请提及任何可能有用的来源。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)