问题描述
我有3台vms(开源版的主控两段主机),每台32核64线程,内存251G。 有一个大表,有近70个字段和一亿条记录。 定义部分如下:
with (appendonly=true,compresslevel=5)
distributed by(record_id) partition by range(dt_date)
(partition p201012 start ('2021-01-01'::date) end ('2021-01-31'::date) every ('1 days'::interval))
簇有 30 个主段和 30 个镜像段。 插入(
所以我的问题是:有没有人使用 Gpdb?有什么办法可以加快速度吗?
谢谢你!
解决方法
我最初的想法是,对于系统上的那几个 cpu,您有太多的主要/镜像 (30)。一般的经验法则是每段 3-4 cpu/vcpu(即 postgres 数据库)。您的系统应该重新配置为每个主机只有 2 个主节点,以更好地利用主机上的 CPU 和内存; 1 在段主机上使用少量内存甚至可能会更好。
就目前的情况而言,您正在用太多数据库试图利用太少的系统资源淹没系统。
吉姆