为什么当记录数增加时我的查询变得太慢

问题描述

我在 sql Server 中有一条插入语句。

我尝试了较小的子集，速度很快

将数量增加到 100 万条记录，并且速度快了 1 分 10 秒

现在我把它加倍了，它似乎卡住了它现在已经运行了 10 分钟，但没有结果

我在 5 分钟时加入了计划。

https://www.brentozar.com/pastetheplan/?id=r15MPuC5u

也许有人可以告诉我如何改进流程。

附注。我在标签 (RepID) 上添加了非聚集索引。

Tag(iiD) 是主键

Reps(RepID) 是主键。

在我写这篇文章的时候。过程在11:47结束

https://www.brentozar.com/pastetheplan/?id=HJd9uOCcu

这是我的代码

insert into R3..Tags (iID,DT,RepID,Tag,xmiID,iBegin,iEnd,Confidence,Polarity,Uncertainty,Conditional,Generic,HistoryOf,CodingScheme,Code,CUI,TUI,PreferredText,ValueBegin,ValueEnd,Value,Deleted,sKey,RepType)
SELECT T.iID,T.DT,T.RepID,T.Tag,T.xmiID,T.iBegin,T.iEnd,T.Confidence,T.Polarity,T.Uncertainty,T.Conditional,T.Generic,T.HistoryOf,T.CodingScheme,T.Code,T.CUI,T.TUI,T.PreferredText,T.ValueBegin,T.ValueEnd,T.Value,T.Deleted,T.sKey,R.RepType
FROM Recovery..tags  T inner join Recovery..Reps R on T.RepID = R.RepID
where T.iID between 2000001 and 4000000

解决方法

（评论里放不下，放在这里）

我认为，您对此几乎无能为力，这取决于您的硬件，11 分钟实际上还不错，在执行计划中，我可以看到一切正常。

但是对于您的信息，该插入语句的瓶颈是从 T"Recovery..tags" 表中读取数据，这花费了 07 分钟的查询时间。（它使用了完整扫描，考虑到它需要读取 2百万行并返回很多列）

所以你唯一能做的就是找到一种方法来加快从链接服务器“恢复”的读取速度。链接服务器通常是性能不佳的根源，特别是大量数据，这可能是由于网络不佳或网络繁忙等......

无论如何，一种解决方案是：

将数据从链接服务器拉入表格到 R3 服务器（直接）中，服务器位于中间。这取决于您的情况
将您的查询更改为针对该表

这可以显着缩短您的查询时间

sql sql sql-execution-plan sql-server tsql