如何通过id在postgres的LIST分区表中获取元素,而不扫描所有表的索引?

问题描述

我在pg专业11中有以下情况:

DROP TABLE IF EXISTS public.agent_sessions_partitioned;

CREATE TABLE public.agent_sessions_partitioned
            (
                id uuid NOT NULL DEFAULT uuid_generate_v4(),account_id uuid,user_id uuid
            ) PARTITION BY LIST (account_id);

CREATE TABLE "agent_sessions_bcbc5acc-f020-4073-bdf4-3098bc043e8b"
                  PARTITION OF agent_sessions_partitioned
                  FOR VALUES IN ('bcbc5acc-f020-4073-bdf4-3098bc043e8b'); 

INSERT INTO agent_sessions_partitioned (id,account_id,user_id)
    SELECT agent_sessions.id,user_id FROM agent_sessions; 

ALTER TABLE "agent_sessions_bcbc5acc-f020-4073-bdf4-3098bc043e8b" ADD PRIMARY KEY (id); 

以此类推。

我有这样的查询时,这很好用:

Select * from agent_sessions_partitioned where account_id = 'XX'

但是因为我使用的是ORM(轨道-活动记录),所以我无法选择始终在语句中以及需要执行以下操作时使用account_id:

UPDATE agent_sessions_partitioned set user_id = 'x' where id = 'y'

PG扫描试图找到该元组的所有子表,请参见下面的解释分析:

"Append  (cost=0.28..2612.12 rows=355 width=558) (actual time=0.956..277.658 rows=1 
loops=1)"
"  ->  Index Scan using "agent_sessions_a13f3c88-3022-4676-bd48-6580d8877ae2_pkey" on 
"agent_sessions_a13f3c88-3022-4676-bd48-6580d8877ae2"  (cost=0.28..8.30 rows=1 width=500)             
(actual time=0.955..0.956 rows=1 loops=1)"
"        Index Cond: (id = 'b21a0178-f97c-4598-ba39-bf763ba377b5'::uuid)"
"  ->  Index Scan using "agent_sessions_325774d6-e5e7-4fae-9659-8b76349a6c2a_pkey" on 
"agent_sessions_325774d6-e5e7-4fae-9659-8b76349a6c2a"  (cost=0.29..8.30 rows=1 width=481) 
(actual time=0.750..0.750 rows=0 loops=1)"
"        Index Cond: (id = 'b21a0178-f97c-4598-ba39-bf763ba377b5'::uuid)"
"  ->  Index Scan using "agent_sessions_1f781bcd-b941-4915-949a-9af893d8f066_pkey" on 
"agent_sessions_1f781bcd-b941-4915-949a-9af893d8f066"  (cost=0.29..8.30 rows=1 width=507) 
 (actual time=1.523..1.523 rows=0 loops=1)"

由于我没有选择更改通过ID更新记录的查询,因此在postgres方面我可以做些什么?可能对我有帮助的任何配置或其他类型的分区,甚至是版本升级到第12/13页?

解决方法

不,除非您对表进行不同的分区,否则无法避免这种增加的计划和执行成本。

与通常的看法相反,对表进行分区会减慢使用该表的大多数SQL语句的速度。仅在极少数情况下,当您可以将顺序扫描限制为分区的子集时,您会看到性能提高。请注意,对大表进行索引扫描并不比对小表进行索引扫描慢。

相反,您可以使用分区来提高批量操作中添加和删除许多表行的速度和灵活性(在PostgreSQL中,这也有助于在大表上自动清空)。性能对查询的影响是您为此付出的代价。

除非您有太多分区(当心!),否则影响应该不会太差。您可以使用准备好的语句来减少对问题的查询的计划时间。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...