问题描述
我正在寻找有关NVCC编译器选择以优化代码的详细文档。但是到目前为止,我在Nvidia文档或文学作品中都找不到任何有趣的东西。
解决方法
不,没有任何官方或其他文档描述编译器内部。
如果您满足以下条件,您也许可以推断出一些基本知识:
- 您可以在以下位置查看官方文档
特别是,如果您决定使用这些标志,则需要了解目标GPU的硬件细节,包括寄存器,内存。
- 指令集参考会很有帮助,可以在以下网址找到
https://docs.nvidia.com/cuda/cuda-binary-utilities/index.html#instruction-set-ref
- 非正式地,学术界已经进行了大量分析,例如,表征延迟,
https://www.groundai.com/project/instructions-latencies-characterization-for-nvidia-gpgpus/1
- cuobjdump 实用程序可用于分析生成的代码,如(在此也描述了ass)中所述
https://forums.developer.nvidia.com/t/solved-sass-code-analysis/41167