问题描述
CUDA 3.0 工具包文档listed NVIDIA 的 OpenCL 编译器接受的几个标志,作为超出 OpenCL 标准要求的扩展:
选项 | 描述 |
---|---|
-cl-nv-maxrregcount <N> |
内核(或设备函数?)可以使用的最大寄存器数);作为 --maxrregcount | 传递给 ptxas
-cl-nv-opt-level <N> |
代码优化级别。 |
-cl-nv-verbose |
启用详细模式。 |
但我知道还有其他人。例如,clcc 项目提到了 cl-nv-arch
和 cl-nv-cstd
(实际上是针对 OpenCL C 版本)。我依稀记得一个特别的标志,它关闭了对超出 CUDA 原生支持的网格和块大小的网格/块大小的支持。在最近的 NVIDIA OpenCL 运行时版本中,如何确定这些额外标志?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)