简介¶
Slurm(Simple Linux Utility for Resource Management,http://slurm.schedmd.com/)是开源的、具有容错性和高度可扩展大型和小型Linux集群资源管理和作业调度系统。超级计算系统可利用Slurm进行资源和作业管理,以避免相互干扰,提高运行效率。所有需运行的作业无论是用于程序调试还是业务计算均必须通过交互式并行srun
、批处理式sbatch
或分配式salloc
等命令提交,提交后可以利用相关命令查询作业状态等。请不要在登录节点直接运行作业(编译除外),以免影响其余用户的正常使用。
目录索引¶
- 基本概念
- 显示队列、节点信息: sinfo
- 查看服务质量
- 作业提交
- 将文件同步到各节点:sbcast
- 吸附到作业步:sattach
- 查看记账信息:sacct
- 其他命令: scancel, scontrol等
或请参见左侧目录索引。