PyCUDA通过值将变量传递给内核

问题描述

应该足够简单;我从字面上想将int发送到SourceModule内核声明,其中C函数
__global__......(int value,.....)
值被声明并调用...
value = 256
...
...
func(value,...)
但是我从pycuda中收到各种错误,这些错误是我使用了错误的类型。

解决方法

标准的PyCUDA函数接口要求参数具有numpy dtypes,因为它在内部确实映射到C类型。因此,对于按值传递的标量参数,您需要先“投射”到合适的numpy dtype。就像是
value = 256
va = numpy.int32(value)

func(va)
应该管用。如果要传递单精度浮点值或数组,请确保显式使用np.float32的dtype,因为numpy默认情况下使用双精度,并且最终会出现类似错误。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...