问题描述
我有兴趣为我的 CUDA 程序收集各种指标。所以我想跑:
nvprof --metrics all pgm.cu
但是当我使用 Google Colab 时,我们使用 %%cu cell-magic 运行 CUDA 程序,因此我们甚至无法将单元命名为 pgm.cu。我尝试将 pgm.cu 文件上传到 Colab 的 Files 部分,然后运行:
!nvcc -g -G pgm.cu
!./a.out
!nvprof --metrics all ./a.out
但是当我以这种方式运行 a.out 时,它似乎甚至没有启动内核。似乎要让 GPU 启动内核,我们需要运行 %%cu cell-magic。所以 !nvprof 也不起作用,因为它说没有收集分析信息,因为内核甚至没有启动(注意:我确实更改了运行时类型以使用 GPU 加速器)。
那么如何让 nvprof 运行?是通过细胞魔法,还是通过上述方法?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)