在PostgreSQL中计算和节省空间

我有一个表在pg像这样:
CREATE TABLE t (
    a BIGSERIAL NOT NULL,-- 8 b
    b SMALLINT,-- 2 b
    c SMALLINT,-- 2 b
    d REAL,-- 4 b
    e REAL,-- 4 b
    f REAL,-- 4 b
    g INTEGER,-- 4 b
    h REAL,-- 4 b
    i REAL,-- 4 b
    j SMALLINT,-- 2 b
    k INTEGER,-- 4 b
    l INTEGER,-- 4 b
    m REAL,-- 4 b
    CONSTRAINT a_pkey PRIMARY KEY (a)
);

以上每行最多可添加50个字节。我的经验是,我需要另一个40%到50%的系统开销,甚至没有任何用户创建的索引上述。所以,每行约75字节。我将在表中有许多行,可能上升145亿行,因此表将推动13-14太字节。如果有的话,我可以使用什么技巧来压缩这张表?我可能的想法下面…

将实数值转换为整数。如果它们可以存储为smallint,那就是每个字段节省2个字节。

将列b .. m转换为数组。我不需要搜索这些列,但我需要能够一次返回一列的值。所以,如果我需要列g,我可以做类似的

SELECT a,arr[5] FROM t;

我可以用数组选项保存空间吗?会有速度惩罚吗?

任何其他想法?

我在数组中存储几个数字字段时没有看到任何东西(和要丢失的东西)。

size of each numerical type清楚地记录下来,你应该简单地使用与你想要的范围分辨率兼容的最小尺寸的类型;这就是所有你能做的。

我不认为(但我不知道)如果有一些行的字段对齐要求,在这种情况下,列的重新排序可能会改变所使用的空间 – 但我不这么认为。

BTW,每行有一个固定开销,大约是23 bytes

相关文章

文章浏览阅读601次。Oracle的数据导入导出是一项基本的技能,...
文章浏览阅读553次。开头还是介绍一下群,如果感兴趣polardb...
文章浏览阅读3.5k次,点赞3次,收藏7次。折腾了两个小时多才...
文章浏览阅读2.7k次。JSON 代表 JavaScript Object Notation...
文章浏览阅读2.9k次,点赞2次,收藏6次。navicat 连接postgr...
文章浏览阅读1.4k次。postgre进阶sql,包含分组排序、JSON解...