NVIDIA Nsight Systems CLI 未获取内存统计信息

问题描述

我正在使用 NVIDIA Nsight Systems cli (nsys) 来分析一个简单的 cuda 程序(向量相加)。我已经检查了文档,但我想我遗漏了一些东西。

我正在运行带有 nsys profile 标志的 --stats=true 命令。

CUDA API Statistics:

 Time(%)  Total Time (ns)  Num Calls    Average      Minimum     Maximum            Name
 -------  ---------------  ---------  ------------  ----------  ----------  ---------------------

CUDA Kernel Statistics:

 Time(%)  Total Time (ns)  Instances    Average      Minimum     Maximum                       Name

这就是我要回来的(省略了值)。我应该启用某个标志来显示内存统计信息吗?

使用 --trace=cuda 标志进行测试,但同样没有内存统计数据

  • 主机:Windows 10
  • Cuda 工具包版本:11.0
  • Nvidia Nsight 版本:2021.1.1

这是 Windows 和 Cuda 之间的兼容性问题,我应该降级吗?我真的不知道。 当我在 Ubuntu 中运行相同的命令时工作正常。这真的让我发疯。

欢迎任何帮助 谢谢

解决方法

您所指的 memory operation statistics 跟踪统一内存 (UM) 按需分页传输活动。

Windows does not used demand-paged transfer of data 上的 UM 模型,因此您不会在 Windows 上看到这些部分。