问题描述
我在工作站上安装了 slurm,它似乎可以工作,我可以使用 slurm 命令,srun 也可以正常工作。
但是,当我尝试使用 sbatch test.sh
从脚本启动作业时,我收到以下错误:批量作业提交失败:将脚本/环境写入文件的 I/O 错误,即使脚本是最简单的喜欢
#!/bin/bash
srun hostname
解决方法
确保 slurmd
以 root
的身份运行。请参阅 SlurmdUser
中的 slurm.conf
参数。它的默认值是 root
,应该是这样。
注意这与 SlurmUser
参数不同,它定义了运行控制器进程的用户;这个最好不是root
。
如果配置正确,那么您可能在 SlurmdSpoolDir
参数中引用的位置有一个错误的文件系统,其中 slurmd
为分配给节点的作业编写提交脚本和环境。