由于不受“支持”的停顿原因,NSight Compute 显示什么?

问题描述

CUDA Profiling Guide 列出了采样的经纱停顿的各种 reasons,例如Allocation、Barrier、LG Throttle 等。而且 - NSight Compute 分析器显示这些分布作为分析结果的一部分。

问题是,某些停顿原因被列为仅从某些计算能力开始支持,例如“LG 油门:7.0+”

我的问题:如果停顿原因是“不受支持”的原因,那么在具有较早计算能力的设备中会发生什么?或者,换句话说,列出的每个停顿原因的回退是什么?

在 Ye Olde NVIDIA Visual Profiler 中,我们有一个“其他”停顿原因,请参阅:

What are "Other" Issue Stall Reasons displayed by the Nsight profiler?

但我在(我的)NSight Compute 版本中没有看到这一点。

解决方法

Nsight 计算是 not supported and not the recommended profiler for GPUs with a compute capability prior to 7.0

对于不受支持的设置中的工具行为,没有正式的定义。将其视为 UB。

对具有 cc7.0 之前的计算能力的 GPU 使用旧式分析器(nvvp、nvprof)。

,

在 Pascal GPU (sm_61) 上使用 Nsight Compute 2019.5 分析内核,需要 7.0+ 的指标 LG ThrottleSleeping 不会显示为停顿原因。

Warp states Pascal