UCX 警告意外的标签接收

问题描述

以下原因可能是什么/如何调试?它在关闭我的 MPI 应用程序时发生

[1612979755.727913] [compute-0-9:21112:0]       tag_match.c:61   UCX  WARN  unexpected tag-receive descriptor 0x2b2bf64cdbc0 was not matched

解决方法

假设应用程序正常退出,这可能意味着某个进程向目标进程发送了一条消息(例如调用 MPI_Send),但在调用 MPI_Finalize 之前没有发布匹配的接收。见https://github.com/openucx/ucx/issues/6331#issuecomment-778428537