问题描述
以下原因可能是什么/如何调试?它在关闭我的 MPI 应用程序时发生
[1612979755.727913] [compute-0-9:21112:0] tag_match.c:61 UCX WARN unexpected tag-receive descriptor 0x2b2bf64cdbc0 was not matched
解决方法
假设应用程序正常退出,这可能意味着某个进程向目标进程发送了一条消息(例如调用 MPI_Send
),但在调用 MPI_Finalize
之前没有发布匹配的接收。见https://github.com/openucx/ucx/issues/6331#issuecomment-778428537