有没有办法加快Greenplum的速度?

问题描述

我有3台vms(开源版的主控两段主机),每台32核64线程,内存251G。 有一个大表,有近70个字段和一亿条记录。 定义部分如下:

with (appendonly=true,compresslevel=5)
distributed by(record_id) partition by range(dt_date)
(partition p201012 start ('2021-01-01'::date) end ('2021-01-31'::date) every ('1 days'::interval))

簇有 30 个主段和 30 个镜像段。 插入(

所以我的问题是:有没有人使用 Gpdb?有什么办法可以加快速度吗?

谢谢你!

解决方法

我最初的想法是,对于系统上的那几个 cpu,您有太多的主要/镜像 (30)。一般的经验法则是每段 3-4 cpu/vcpu(即 postgres 数据库)。您的系统应该重新配置为每个主机只有 2 个主节点,以更好地利用主机上的 CPU 和内存; 1 在段主机上使用少量内存甚至可能会更好。

就目前的情况而言,您正在用太多数据库试图利用太少的系统资源淹没系统。

吉姆

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...