c – 在nvidia cuda内核中创建数组

嗨,我只想知道是否可以在nvidia cuda内核中执行以下操作
__global__ void compute(long *c1,long size,...)
 {
  ...
  long d[1000];
  ...
 }

或以下

__global__ void compute(long *c1,...)
 {
  ...
  long d[size];
  ...
 }

解决方法

你可以做第一个例子,我没有尝试过第二个例子.

但是,如果您可以帮助它,您可能需要重新设计您的程序不要这样做.您不想在内核中分配4000字节的内存.这将导致大量使用CUDA本地内存,因为您将无法将所有内容都装入寄存器. CUDA本地内存缓慢(400个周期的内存延迟).

相关文章

本程序的编译和运行环境如下(如果有运行方面的问题欢迎在评...
水了一学期的院选修,万万没想到期末考试还有比较硬核的编程...
补充一下,先前文章末尾给出的下载链接的完整代码含有部分C&...
思路如标题所说采用模N取余法,难点是这个除法过程如何实现。...
本篇博客有更新!!!更新后效果图如下: 文章末尾的完整代码...
刚开始学习模块化程序设计时,估计大家都被形参和实参搞迷糊...