除了 OpenCL 标准之外,NVIDIA OpenCL 编译器还支持哪些标志?

问题描述

CUDA 3.0 工具包文档listed NVIDIA 的 OpenCL 编译器接受的几个标志,作为超出 OpenCL 标准要求的扩展:

传递给 ptxas
选项 描述
-cl-nv-maxrregcount <N> 内核(或设备函数?)可以使用的最大寄存器数);作为 --maxrregcount
-cl-nv-opt-level <N> 代码优化级别。
-cl-nv-verbose 启用详细模式。

但我知道还有其他人。例如,clcc 项目提到了 cl-nv-archcl-nv-cstd(实际上是针对 OpenCL C 版本)。我依稀记得一个特别的标志,它关闭了对超出 CUDA 原生支持的网格和块大小的网格/块大小的支持。在最近的 NVIDIA OpenCL 运行时版本中,如何确定这些额外标志?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)