问题描述
我在 sql Server 中有一条插入语句。
我尝试了较小的子集,速度很快
将数量增加到 100 万条记录,并且速度快了 1 分 10 秒
现在我把它加倍了,它似乎卡住了它现在已经运行了 10 分钟,但没有结果
我在 5 分钟时加入了计划。
https://www.brentozar.com/pastetheplan/?id=r15MPuC5u
也许有人可以告诉我如何改进流程。
Tag(iiD) 是主键
Reps(RepID) 是主键。
在我写这篇文章的时候。过程在11:47结束
https://www.brentozar.com/pastetheplan/?id=HJd9uOCcu
这是我的代码
insert into R3..Tags (iID,DT,RepID,Tag,xmiID,iBegin,iEnd,Confidence,Polarity,Uncertainty,Conditional,Generic,HistoryOf,CodingScheme,Code,CUI,TUI,PreferredText,ValueBegin,ValueEnd,Value,Deleted,sKey,RepType)
SELECT T.iID,T.DT,T.RepID,T.Tag,T.xmiID,T.iBegin,T.iEnd,T.Confidence,T.Polarity,T.Uncertainty,T.Conditional,T.Generic,T.HistoryOf,T.CodingScheme,T.Code,T.CUI,T.TUI,T.PreferredText,T.ValueBegin,T.ValueEnd,T.Value,T.Deleted,T.sKey,R.RepType
FROM Recovery..tags T inner join Recovery..Reps R on T.RepID = R.RepID
where T.iID between 2000001 and 4000000
解决方法
(评论里放不下,放在这里)
我认为,您对此几乎无能为力,这取决于您的硬件,11 分钟实际上还不错,在执行计划中,我可以看到一切正常。
但是对于您的信息,该插入语句的瓶颈是从 T"Recovery..tags" 表中读取数据,这花费了 07 分钟的查询时间。(它使用了完整扫描,考虑到它需要读取 2百万行并返回很多列)
所以你唯一能做的就是找到一种方法来加快从链接服务器“恢复”的读取速度。 链接服务器通常是性能不佳的根源,特别是大量数据,这可能是由于网络不佳或网络繁忙等......
无论如何,一种解决方案是:
- 将数据从链接服务器拉入表格到 R3 服务器(直接)中,服务器位于中间。这取决于您的情况
- 将您的查询更改为针对该表
这可以显着缩短您的查询时间