使用 ncu 分析统一内存中的页面错误

问题描述

是否有任何选项可以使用 Nsight Compute (NCU) 分析统一虚拟内存 CUDA 应用程序?例如,我想知道处理页面错误和迁移所花费的时间。

解决方法

最后,我自己想出了解决方案。只需要指定 --export=json 将分析结果输出到 json 文件中即可获取页面错误的详细指标。 整体分析命令如下所示。

nsys profile \
     --force-overwrite=true \
     --cuda-um-gpu-page-faults=true \
     --cuda-um-cpu-page-faults=true \
     --export=json \
     ./yourapplication