为什么当记录数增加时我的查询变得太慢

问题描述

我在 sql Server 中有一条插入语句。

我尝试了较小的子集,速度很快

数量增加到 100 万条记录,并且速度快了 1 分 10 秒

现在我把它加倍了,它似乎卡住了它现在已经运行了 10 分钟,但没有结果

我在 5 分钟时加入了计划。

https://www.brentozar.com/pastetheplan/?id=r15MPuC5u

也许有人可以告诉我如何改进流程。

附注。我在标签 (RepID) 上添加了非聚集索引。

Tag(iiD) 是主键

Reps(RepID) 是主键。

在我写这篇文章的时候。过程在11:47结束

https://www.brentozar.com/pastetheplan/?id=HJd9uOCcu

这是我的代码

insert into R3..Tags (iID,DT,RepID,Tag,xmiID,iBegin,iEnd,Confidence,Polarity,Uncertainty,Conditional,Generic,HistoryOf,CodingScheme,Code,CUI,TUI,PreferredText,ValueBegin,ValueEnd,Value,Deleted,sKey,RepType)
SELECT T.iID,T.DT,T.RepID,T.Tag,T.xmiID,T.iBegin,T.iEnd,T.Confidence,T.Polarity,T.Uncertainty,T.Conditional,T.Generic,T.HistoryOf,T.CodingScheme,T.Code,T.CUI,T.TUI,T.PreferredText,T.ValueBegin,T.ValueEnd,T.Value,T.Deleted,T.sKey,R.RepType
FROM Recovery..tags  T inner join Recovery..Reps R on T.RepID = R.RepID
where T.iID between 2000001 and 4000000

解决方法

(评论里放不下,放在这里)

我认为,您对此几乎无能为力,这取决于您的硬件,11 分钟实际上还不错,在执行计划中,我可以看到一切正常。

但是对于您的信息,该插入语句的瓶颈是从 T"Recovery..tags" 表中读取数据,这花费了 07 分钟的查询时间。(它使用了完整扫描,考虑到它需要读取 2百万行并返回很多列)

所以你唯一能做的就是找到一种方法来加快从链接服务器“恢复”的读取速度。 链接服务器通常是性能不佳的根源,特别是大量数据,这可能是由于网络不佳或网络繁忙等......

无论如何,一种解决方案是:

  • 将数据从链接服务器拉入表格到 R3 服务器(直接)中,服务器位于中间。这取决于您的情况
  • 将您的查询更改为针对该表

这可以显着缩短您的查询时间