问题描述
在编译源代码时,我仍然无法完全理解cuda的计算能力。
假定二进制文件是使用( code = sm_30,compute = 30 )到( code = sm_62,compute = 62 )的标志进行编译的(nvcc版本是10.1),
Turing设备(例如RTX2080Ti)运行这些二进制文件时会发生什么?
即使二进制文件不包含针对Turing架构的 code = sm_75,compute = 75 ,为什么它们仍可以在Turing设备上正常运行?
Turing设备JIT是否编译 compute = 62 的PTX代码(因为未提及 compute = 75 )并生成Turing的SASS(代码= sm_75)而不是 65 在运行时的SASS?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)