MySQL 表连接策略 NLJ vs BNL

select * from t1 join t2 on t1.c = t1.c 这样的语句，MysqL优化器会选择t_a或t_b作为驱动表, 使用straight_join来指定左边的表为驱动表。如果字段c上有建立索引，MysqL会使用 Index nested-Loop Join 策略处理join，否则会使用Block nested-Loop Join 来处理。

什么是Index nested-Loop Join

如果连接表的字段上索引，会使用index nested-loop join 算法，会这样处理：

从驱动表t1取出记录一行记录R；
根据连接字段去t2搜索；
取出匹配的t2记录，跟R组成一行，作为结果集的一部分。
重复值执行以上步骤，直到扫描完t1

在这个过程中，驱动表是走全表扫描，而被驱动表是走树搜索

使用join语句，性能比强行拆成多个单表执行sql语句的性能要好；
如果使用join语句的话，需要让小表做驱动表。

什么是 Block neste-Loop Join

由于连接字段没有索引，这次不能通过走树索引去查询t2表了。查询过程如下：

扫描t1，顺序读数据放入join_buffer, 如果join_buffer满了，则分多次存入。
扫描t2，与join_buffer中的记录对比
清空join_buffer
重复上面步骤，直到t1扫描完成。

这个过程中，t2会被扫描多次，减少t1加载进join_buffer的次数，可以优化查询效率。join_buffer_size 参数控制了join_buffer的大小，如果join很慢，尝试改大这个join_buffer_size。
驱动表会被分多次放进join_buffer_size, 因此驱动表越小越好

Block nested-Loop join 会占用大量的系统资源，如果在explain结果中，看到Block nested Loop，尝试在连接的字段加索引吧

MySQL 表连接策略 NLJ vs BNL

什么是Index nested-Loop Join

什么是 Block neste-Loop Join

相关文章