PostgreSQL多列索引,包括数组

问题描述

文档建议对数组列使用GIN索引。但是,我想通过该列和一个布尔列的组合进行查询,并且由于GIN不支持该类型,因此无法将布尔值添加到索引中。我是否最好(a)为布尔列创建单独的索引,(b)使用其他索引类型(哪个?),或者(c)不给布尔列建立索引,因为在我的情况下,通过数组的列索引将只有几行,因此,如果查询优化器在其中搜索匹配的布尔值,它将只有很少的比较?

create table foo (
    id integer generated by default as identity primary key,...
    bar bool not null,-- Todo: Separate index? Cannot include bool in GIN index
    ...
    baz smallint[] not null);
create index foo_baz_idx on lambdas using gin (baz);

大多数查询将以select * from foo where X = any(baz) and bar = Y的形式出现,仅搜索X时最多只能有少量的行

解决方法

这实际上取决于数据的性质。如果where X = any(baz)导致行数较少,则无需索引bar

如果where X = any(baz)导致大量行,则bar上的单独索引可能会有所帮助;它将为查询计划者提供更多选择。但是,由于它是布尔值,因此您可以在bar上使用partition the table。然后,每个查询都会在where bar = ?上有效地建立索引。

在某些情况下,尤其是在表中大多数被频繁访问的行位于单个分区或少量分区中时,查询性能可以得到显着提高。分区替代了索引的前几列,从而减小了索引的大小,并使索引中经常使用的部分更适合内存。

当查询或更新访问单个分区的很大一部分时,可以通过对该分区进行顺序扫描而不是使用索引和遍及整个表的随机访问读取来提高性能。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...