问题描述
我曾经在后台运行HPC-PBS作业,每个节点有1个节点,使用./a&到10个核心,分别位于不同文件夹中。脚本的主要部分是
for j in {1..10..1};
do
cd $j
icc -o a Code.c;./a&
cd ..
done
现在,由于代码很大且容易出错,因此某些后台作业会停止,而其他后台作业会平稳运行。在单独检查每个文件夹之前,我没有收到有关这10个基础作业的信息。PBS仅对所有10个作业返回一个作业ID,并在所有作业完成后返回退出状态。 是否可以以某种方式直接检查哪个后台线程已停止并从同一脚本重新启动,或者可能是其他链接的脚本?
注意:我是用户,因此不能使用“ sudo”。 “顶部”也没有意义。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)