从 GPU 到持久内存的 cudaMemcpy 是否需要向后刷新和围栏操作?

问题描述

我正在执行从 GPU 到持久内存的 cudamemcpy 操作。在从 DRAM 到持久内存的 memcpy 操作的情况下,是否需要额外的刷新(clflush/clflushopt)和 sfence 操作以实现数据一致性? GPU 是否也需要持久内存?还是由 Cuda 处理?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)