问题描述
假设我在25个不同的机器上运行一个包含25个进程的MPI程序。该程序在其中一个称为“主机”的程序中启动,例如
mpirun -n 25 --hostfile myhostfile.txt python helloworld.py
这是在Linux上使用某些bash脚本执行的,它使用mpi4py。有时,在执行过程中,我想停止所有机器上的程序。我不在乎是不是很亲切,因为我可能需要的数据已经保存了。
通常,我在“主”终端上按 Ctrl + C ,我认为它的工作原理如上所述。这是真的?换句话说,它会在所有机器上停止该特定的MPI程序吗?
我尝试的另一种方法是在“主”中获取进程的PID并杀死它。我也不确定。
上述方法是否按所述方式工作?如果没有,您还有什么建议?请注意,我想避免为此目的使用MPI_Abort
之类的MPI调用,而其他讨论here和here则建议这样做。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)