问题描述
可以使用nvprof来访问/读取CUDA执行程序的库冲突计数器:
nvprof --events shared_st_bank_conflict,shared_ld_bank_conflict my_cuda_exe
- 是否有办法从OpenCL环境(也许直接从ptx)中提取
nvprof
之外的这些计数器? - 或者,可以使用
clGetProgramInfo
和CL_PROGRAM_BINARIES
将cuModuleLoadDataEx
和nvprof
一起使用n {{1} }}? - 是否有任何允许设置诸如库大小等参数的模拟cpu后端?
其他选项:
解决方法
有什么方法可以从OpenCL的nvprof外部提取这些计数器 环境,也许直接来自ptx?
不。 CUDA中也没有,OpenGL,DirectX或Vulkan中也没有计算着色器。
或者有什么方法可以转换从 使用clGetProgramInfo和
的nvidia OpenCL编译器 CL_PROGRAM_BINARIES到CUDA内核并使用
运行 cuModuleLoadDataEx,从而能够使用nvprof?
不。 OpenCL PTX和CUDA PTX不同,不能互换使用
是否有任何允许设置此类参数的仿真CPU后端 如银行规模等?
我不知道。