SQL Server Execpt和not in 性能区别

感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧!

主要讲 except 和 not in 的性能上的区别。

代码如下:

 
CREATE TABLE tb1(ID int) 
CREATE TABLE tb2(ID int) 
BEGIN TRAN 
DECLARE @i INT = 500 
WHILE @i > 0 
begin 
INSERT INTO dbo.tb1 
VALUES ( @i -- v - int 
) 
SET @i = @i -1 
end 
COMMIT我测试的时候tb1 是1000,tb2 是500 
 

代码如下:

 
DBCC FREESYstemCACHE ('ALL','default'); 
SET STATISTICS IO ON 
SET STATISTICS TIME on 
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2; 
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值 
SET STATISTICS IO OFF 
SET STATISTICS TIME OFF 

执行计划:

代码如下:

 
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2; 
|--Merge Join(Right Anti Semi Join,MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]),RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID])) 
|--Sort(disTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC)) 
| |--Table Scan(OBJECT:([master1].[dbo].[tb2])) 
|--Sort(disTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC)) 
|--Table Scan(OBJECT:([master1].[dbo].[tb1])) 
 

代码如下:

 
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值 
|--Hash Match(Right Anti Semi Join,HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]),RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID])) 
|--Table Scan(OBJECT:([master1].[dbo].[tb2])) 
|--nested Loops(Left Anti Semi Join) 
|--nested Loops(Left Anti Semi Join,WHERE:([master1].[dbo].[tb1].[ID] IS NULL)) 
| |--Table Scan(OBJECT:([master1].[dbo].[tb1])) 
| |--Top(TOP EXPRESSION:((1))) 
| |--Table Scan(OBJECT:([master1].[dbo].[tb2])) 
|--Row Count Spool 
|--Table Scan(OBJECT:([master1].[dbo].[tb2]),WHERE:([master1].[dbo].[tb2].[ID] IS NULL)) 

sql Server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 0 毫秒。
(500 行受影响)
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 1,逻辑读取 1 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(6 行受影响)
(1 行受影响)
sql Server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 528 毫秒。
(500 行受影响)
表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 3,逻辑读取 1002 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(10 行受影响)
(1 行受影响)
sql Server 执行时间:
cpu 时间 = 16 毫秒,占用时间 = 498 毫秒。
sql Server 执行时间:
cpu 时间 = 0 毫秒,占用时间 = 0 毫秒。

结论:通过较多数据 和 较少数据的测试,在较少数据的情况下 not in 比 except 性能好,但是在较多数据情况下 execpt 比 not in 出色。
看执行计划可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。

如果大家有兴趣可以看看 not exists 的执行计划。建议:
大家不要迷信测试结果,因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。
所以过度的迷信测试结果,可能会对生产库造成性能的影响达不到预期的性能效果

相关文章

SELECT a.*,b.dp_name,c.pa_name,fm_name=(CASE WHEN a.fm_n...
if not exists(select name from syscolumns where name=&am...
select a.*,pano=a.pa_no,b.pa_name,f.dp_name,e.fw_state_n...
要在 SQL Server 2019 中设置定时自动重启,可以使用 Window...
您收到的错误消息表明数据库 'EastRiver' 的...
首先我需要查询出需要使用SQL Server Profiler跟踪的数据库标...