nvprof警告:可能未在LD_LIBRARY_PATH

问题描述

当我尝试通过Nvidia的nvprof探查器运行使用OpenACC开发的程序时,我收到主题消息:

nvprof ./SFS 4

如果我使用nvprof运行-o [output_file],则不会出现警告消息,但不会创建输出文件。这里可能出什么问题了?

在我的LD_LIBRARY_PATH中将.bashrc设置为:/opt/nvidia/hpc_sdk/Linux_x86_64/20.7/cuda/11.0/lib64/,因为在那里我找到了这些文件(它们的名称中有“ cupti”和“ inj”,我认为它们是所需的):

lrwxrwxrwx 1 root root      19 Aug  4 05:27 libaccinj64.so -> libaccinj64.so.11.0
lrwxrwxrwx 1 root root      23 Aug  4 05:27 libaccinj64.so.11.0 -> libaccinj64.so.11.0.194
...
lrwxrwxrwx 1 root root      16 Aug  4 05:27 libcupti.so -> libcupti.so.11.0
lrwxrwxrwx 1 root root      20 Aug  4 05:27 libcupti.so.11.0 -> libcupti.so.2020.1.0
...

我正在使用Ubuntu 18.04。 Nvidia GeForce RTX 2070的工作站,并已安装CUDA版本11。

nvidia-smi命令为我提供了这一点:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66       Driver Version: 450.66       CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 2070    Off  | 00000000:02:00.0  On |                  N/A |
| 30%   40C    P2    58W / 185W |    693MiB /  7981MiB |      3%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

我拥有的编译器(nvidia和portland)来自最新的Nvidia HPC-SDK版本20.7-0

我使用-acc -Minfo=accel选项编译程序,不确定如何设置-ta=以及是否需要设置?

P.S。尽管我确实将nvprof设置为ACC_DEVICE_TYPE,但我也不确定在运行代码时(无论有没有nvidia都使用GPU)。

任何建议都将受到欢迎。

干杯

解决方法

您正在使用哪个nvprof? NV HPC 20.7附带的一个或您自己的安装的?

这看起来与昨天在NVIDIA DevTalk用户论坛上报告的问题非常相似:

https://forums.developer.nvidia.com/t/new-20-7-version-where-is-the-detail-release-bugfix/146168/4

这是针对Nsight系统的,但这可能是相同的问题。探查器的2020.3版本似乎存在问题,这是我们随NV HPC 20.7 SDK一起提供的版本。正如我注意到的那样,Nsight-Systems 2020.4版本应该已修复此问题,因此解决方法是下载并安装2020.4或使用以前的版本。

https://developer.nvidia.com/nsight-systems

Nsight系统的下载似乎确实是暂时的,希望可以在您看到本说明之前予以纠正。

此外,nvprof也已被弃用,因此您应该考虑使用Nsight系统和Nsight计算。

https://developer.nvidia.com/blog/migrating-nvidia-nsight-tools-nvvp-nvprof/

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...