PyCUDA通过值将变量传递给内核

问题描述

应该足够简单;我从字面上想将int发送到SourceModule内核声明,其中C函数
__global__......(int value,.....)
值被声明并调用...
value = 256
...
...
func(value,...)
但是我从pycuda中收到各种错误,这些错误是我使用了错误的类型。

解决方法

标准的PyCUDA函数接口要求参数具有numpy dtypes,因为它在内部确实映射到C类型。因此,对于按值传递的标量参数,您需要先“投射”到合适的numpy dtype。就像是
value = 256
va = numpy.int32(value)

func(va)
应该管用。如果要传递单精度浮点值或数组,请确保显式使用np.float32的dtype,因为numpy默认情况下使用双精度,并且最终会出现类似错误。