mellanox官网测试程序gpu_direct_rdma_access发生无法注册GPU MR

问题描述

我用的是gpu direct rdma的官网库,gpu_direct_rdma_access。我在测试程序的时候,代码报错,Debug信息如下图 enter image description here

最后发现错误的原因是gpu_direct_rdma_access.c的1170行ibv_reg_mr注册的内存返回nullptr。这是什么原因。 代码地址为https://github.com/Mellanox/gpu_direct_rdma_access 我使用的GPU是NVIDIA RTX TITAN,HCA是Connect-X5

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)