除了 OpenCL 标准之外，NVIDIA OpenCL 编译器还支持哪些标志？

问题描述

CUDA 3.0 工具包文档listed NVIDIA 的 OpenCL 编译器接受的几个标志，作为超出 OpenCL 标准要求的扩展：

传递给 ptxas

选项	描述
`-cl-nv-maxrregcount <N>`	内核（或设备函数？）可以使用的最大寄存器数）；作为 --maxrregcount
`-cl-nv-opt-level <N>`	代码优化级别。
`-cl-nv-verbose`	启用详细模式。

但我知道还有其他人。例如，clcc 项目提到了 cl-nv-arch 和 cl-nv-cstd（实际上是针对 OpenCL C 版本）。我依稀记得一个特别的标志，它关闭了对超出 CUDA 原生支持的网格和块大小的网格/块大小的支持。在最近的 NVIDIA OpenCL 运行时版本中，如何确定这些额外标志？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

compilation compiler-options nvidia opencl