是否有关于NVCC编译器优化启发式的文档?

问题描述

我正在寻找有关NVCC编译器选择以优化代码的详细文档。但是到目前为止,我在Nvidia文档或文学作品中都找不到任何有趣的东西。

解决方法

不,没有任何官方或其他文档描述编译器内部。

如果您满足以下条件,您也许可以推断出一些基本知识:

  1. 您可以在以下位置查看官方文档

https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#options-for-steering-gpu-code-generation

特别是,如果您决定使用这些标志,则需要了解目标GPU的硬件细节,包括寄存器,内存。

  1. 指令集参考会很有帮助,可以在以下网址找到

https://docs.nvidia.com/cuda/cuda-binary-utilities/index.html#instruction-set-ref

  1. 非正式地,学术界已经进行了大量分析,例如,表征延迟,

https://www.groundai.com/project/instructions-latencies-characterization-for-nvidia-gpgpus/1

  1. cuobjdump 实用程序可用于分析生成的代码,如(在此也描述了ass)中所述

https://forums.developer.nvidia.com/t/solved-sass-code-analysis/41167

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...