如果cuda二进制文件的计算能力与当前设备的计算能力不匹配怎么办?

问题描述

在编译源代码时,我仍然无法完全理解cuda的计算能力。

假定二进制文件是使用( code = sm_30,compute = 30 )到( code = sm_62,compute = 62 )的标志进行编译的(nvcc版本是10.1),

Turing设备(例如RTX2080Ti)运行这些二进制文件时会发生什么?

即使二进制文件不包含针对Turing架构的 code = sm_75,compute = 75 ,为什么它们仍可以在Turing设备上正常运行?

Turing设备JIT是否编译 compute = 62 的PTX代码(因为未提及 compute = 75 )并生成Turing的SASS(代码= sm_75)而不是 65 在运行时的SASS?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)