PostgreSQL学习第十三篇执行计划

Postgresql中explain的语法：
explain [option] statement
explain [analyze] [verboase] statement

命令的可选选项option为：
analyze
verbose
costs
buffers
format（text|xml|json|yaml）
analyze选项通过实际执行的sql来获得相应的执行计划。（实际执行）
verbose用于显示计划的附加信息：计划树中每个节点输出的各个列，如果触发器被触发，还有触发器名称。默认为false
costs选项显示每个计划节点的启动成本和总成本，以及估计行数和每行宽度。默认为TRUE
buffers：显示关于缓冲区的使用信息。该参数只能与analyze参数一起使用。显示的缓冲区信息包括共享块、本地块和临时块读写的快熟。默认为false
format指定输出格式。默认为TEXT


explain输出结果解释
简单示例：
postgres=# explain select * from dog;
                       QUERY PLAN                       
--------------------------------------------------------
 Seq Scan on dog  (cost=0.00..20.80 rows=1080 width=47)
(1 row)

 Seq Scan on dog：全表扫描
cost=0.00..20.80：启动成本：0.00      返回所有数据的成本：20.80
rows=1080：会返回1080行
width=47：每行平均宽度是47字节

默认情况下不同操作的cost值：

	1. 顺序扫描一个数据库，cost值为1
	2. 随机扫描一个数据块，cost值为4
	3. 处理一个数据行的cpu，cost为0.01
	4. 处理一个索引行的cpu，cost为0.005
	5. 每个操作符的cpu代价为0.0025


以不同格输出：
explain (format json|xml|yaml) select ....

加analyze参数后，可通过实际执行来获得更精确的执行计划。
explain analyze select * ....
explain (analyze true) select * ...

如果只查看执行的路径，不看cost值：
select (costs false) select * ...

联合使用analyze选项和buffers选项，可通过实际执行来查看实际的代价和缓冲区命中情况：
explain (analyze true,buffers true) select * from ....
postgres=# explain (analyze true,buffers true) select * from dog;
                                            QUERY PLAN                                           
--------------------------------------------------------------------------------------------------
 Seq Scan on dog  (cost=0.00..20.80 rows=1080 width=47) (actual time=0.006..0.006 rows=1 loops=1)
   Buffers: shared hit=1
 Planning time: 0.027 ms
 Execution time: 0.019 ms
(4 rows)

可以查看插入，删除等的计划，但是如果加了analyze，就会真的执行，请注意！

全表扫描：Seq Scan
索引扫描：Index Scan
位图扫描：也是走索引的一种方式。方法是扫描索引，把满足条件的行或块在内存中建一个位图，扫描完索引后，再根据位图到表的数据文件中把相应的数据读出来。如果走了两个索引，可以把两个索引形成的位图进行and或or计算，合并成一个位图，再到表的数据文件中把数据读出来。
当执行计划的结果行数很多时会进行这种扫描，如非等值查询、IN子句或有多个条件都可以走不同的索引时。

条件过滤：Filter
嵌套循环连接：nestloop Join，是在两个表做连接时最朴素的一种连接方式。在嵌套循环中，内表被外表驱动，外表返回的每一行都要在内表中检索找到与它匹配的行，要把返回子集较小的表作为外表。而且在内表的连接字段上要有索引，否则会很慢。外表为驱动表。

Hash Join：散列连接，优化器使用两个表中较小的表，并利用连接键在内存中建立散列表，然后扫描较大的表并探测散列表，找出与散列表匹配的行。

Merge Join：合并连接
PostgreSQL学习第十三篇 执行计划

相关文章

PostgreSQL学习第十三篇执行计划