在CUDA的__device__函数中,pow无法正常工作

问题描述

我正在尝试使用Visual Studio 2019在CUDA的pow函数中使用函数__device__

__device__ double Len(double a,double b)
{
    return pow(a,2) + pow(b,2);
}

但是,当我尝试构建解决方案时,它总是给我这个错误。

错误'x64 / Debug / kernel.cu.obj'中对'_Z3powdi'的未定义引用

仅当我将2更改为2.0时才有效。我认为这可能是使用非整数值作为其参数的函数的正确格式,但是当我在普通的 C ++ 代码中尝试使用该函数时,它可以与整数2一起正常工作。

此问题的原因是什么?以及如何解决?

注释:

  1. 几天前它正常工作,此错误可能发生在Visual Studio 2019 16.8.0版的最新更新之后。
  2. 我尝试添加#include <math.h>并将其删除,但它给出了相同的错误。

解决方法

CUDA自2008年前后添加了适当的双精度支持以来,在设备代码中已支持pow (double,int)。这至少是C ++ 98标准(ISO / IEC 14882第26.5节)以来所必需的功能。这是一个包含OP功能的完整示例程序,为简洁起见,省略了错误检查:

#include <stdio.h>
#include <stdlib.h>
#include <math.h>

__device__ double Len(double a,double b)
{
    return pow(a,2) + pow(b,2);
}

__global__ void kernel (double a,double b)
{
    printf ("len = %23.16e\n",Len(a,b));
}

int main (void)
{
    kernel<<<1,1>>>(3,4);
    cudaDeviceSynchronize();
    return EXIT_SUCCESS;
}

此编译没有错误

    Windows 7上的
  • 带有MSVS 2010(Microsoft (R) C/C++ Optimizing Compiler Version 16.00.40219.01 for x64)的CUDA 9.2

  • Windows 10上的
  • CUDA 11.1和MSVS 2019(Microsoft (R) C/C++ Optimizing Compiler Version 19.27.29112 for x64

我为发布和调试版本进行了如下编译(大括号中的参数表示调试版本):

nvcc -o pow_dbl_int.exe {-g -G} pow_dbl_int.cu

可执行文件在运行时产生以下输出:

len =  2.5000000000000000e+01

如果该示例程序无法使用所示的命令行正确编译,则我怀疑MSVS安装或CUDA安装有问题。在我的实践中,我发现先安装MSVS然后再安装CUDA通常是有益的,因此CUDA在安装后可以正确地集成到MSVS中。

由于OP显然安装了几天前才在November 10,2020上发布的MSVS版本,所以主机编译器头文件和CUDA头文件之间也可能不兼容,这就是为什么CUDA历来对支持的主机编译器版本进行了严格检查(不确定是否现在这样做)。我注意到微软此后发布了MSVS 2019 16.8.1,发布日期为2020年11月12日。

如在多条注释和CUDA Best Practices Guide中所指出的那样,平方乘以乘法就更容易完成,而无需调用pow()

,

注意:我不是 C++ 开发人员,所以如果我说的是废话,或者我的解决方案不好,请原谅我。

在我们的 C++/CLI 项目中将 MSVC C++ 工具集更新到 v142 (19.28) 后,我们刚刚遇到了同样的问题。该问题仅在运行时调用 Optix 函数时出现。

我们的 kernel.cu 正在从 CUDA Math API 调用不存在的函数,即使智能感知暗示它正在调用 std lib 函数。我不知道发生了什么或为什么会发生,但它现在起作用了。

在 CUDA Math API 中,有 2 个 pow 函数:

  • double pow ( double x,double y )
  • float powf ( float x,float y )

我所做的只是简单地将我的整数转换为 double (static_cast<double>(3)),然后在另一个带有浮点参数的调用中,将调用从 pow 更改为 powf

,

VS 16.8更新后,我的cuda项目也出现了一些奇怪的构建问题。回滚到16.7.8后,此问题已解决。

link to old version of video studio installer

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...