有没有办法加快Greenplum的速度?

问题描述

我有3台vms(开源版的主控两段主机),每台32核64线程,内存251G。 有一个大表,有近70个字段和一亿条记录。 定义部分如下:

with (appendonly=true,compresslevel=5)
distributed by(record_id) partition by range(dt_date)
(partition p201012 start ('2021-01-01'::date) end ('2021-01-31'::date) every ('1 days'::interval))

簇有 30 个主段和 30 个镜像段。 插入(

所以我的问题是:有没有人使用 Gpdb?有什么办法可以加快速度吗?

谢谢你!

解决方法

我最初的想法是,对于系统上的那几个 cpu,您有太多的主要/镜像 (30)。一般的经验法则是每段 3-4 cpu/vcpu(即 postgres 数据库)。您的系统应该重新配置为每个主机只有 2 个主节点,以更好地利用主机上的 CPU 和内存; 1 在段主机上使用少量内存甚至可能会更好。

就目前的情况而言,您正在用太多数据库试图利用太少的系统资源淹没系统。

吉姆