如何让 CMake 自动检测 CUDA_ARCHITECTURES 的值?

问题描述

较新版本的 CMake(3.18 及更高版本)“知道”选择 CUDA 代码编译目标的 CUDA 架构。目标有一个 CUDA_ARCHITECTURES 属性,设置后会为您生成适当的 -gencode arch=whatever,code=whatever 编译选项。如果您不设置此值,您甚至会收到警告:

CMake Error in CMakeLists.txt:
  CUDA_ARCHITECTURES is empty for target "my_cuda_app".

默认情况下,此目标属性初始化为 CMAKE_CUDA_ARCHITECTURES。但是 CMAKE_CUDA_ARCHITECTURES 本身没有初始化为任何东西 (!)

我们如何让 CMake 自动检测 CUDA_ARCHITECTURES 或全局 CMAKD_CUDA_ARCHITECTURES 的适当值?也就是说,使用系统上安装的 GPU 的架构?

解决方法

CMake 实际上提供了这样的自动检测功能,但是:

  1. 它没有记录(并且可能会在未来的某个时候重构)。
  2. 它是已弃用的 FindCUDA 机制的一部分,旨在直接操作 CUDA_CMAKE_FLAGS(这不是我们想要的)。
  3. 它不会“很好玩”,并且对我们隐藏了其有用的内部变量。

不过,用一点肘部润滑脂,我们可以让它工作。

首先,它的位置:它位于模块 FindCUDA/elect_compute_arch 中(在 Linux 系统上,它位于 /path/to/cmake/root/share/cmake-X.YY/Modules/FindCUDA/elect_compute_arch.cmake 中)。

现在是你如何使用它:

include(FindCUDA/select_compute_arch)
CUDA_DETECT_INSTALLED_GPUS(INSTALLED_GPU_CCS_1)
string(STRIP "${INSTALLED_GPU_CCS_1}" INSTALLED_GPU_CCS_2)
string(REPLACE " " ";" INSTALLED_GPU_CCS_3 "${INSTALLED_GPU_CCS_2}")
string(REPLACE "." "" CUDA_ARCH_LIST "${INSTALLED_GPU_CCS_3}")
LIST(APPEND CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_LIST})

如果你只想要一个目标,你可以将最后一行替换为:

set_property(TARGET my_target PROPERTY ${CUDA_ARCH_LIST})

注意事项:

  • 当您的系统上没有 GPU 时,您可能会得到如下结果:3.5;5.0;5.3;6.0;6.1;7.0;7.5;7.5+PTX

    这是一个 issue with CMake which will not be resolved,因为我们在这里使用的子模块不受官方支持。因此,如果您需要在没有 GPU 的系统上进行编译,请避免此调用或解析“+PTX”条目的结果。

  • select_compute_arch 子模块已经存在了很长时间,但在过去,您会以不同的方式使用它,并将其包含在 include(FindCUDA) 中。

  • 请参阅 CMake 问题 2237519199,了解 CMake 将来可能会在哪些方面处理此问题。警告:我提交了这两个错误 :-P

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...