这个问题重申了之前在应用于SLURM工具进行并行计算时的问题Why is "except: pass" a bad programming practice?。与slurm的工作方式一样,我使用sbatch命令发送一个script.sh文件,以便使用不同的参数进行并行计算。我的script.sh可以简化为基本上只包含一个命令srun python3 py_script.py。我省略了不必要的细节。<do calculations> 我的问题是,当满足condition==0时(我检查了它总是发生),脚本将&q
我正在尝试创建一个函数,作为SLURM的srun命令的插入替代。这个包装器函数的需要是,当在SLURM控制下启动时,我希望使用srun编写脚本,但仍然能够在没有SLURM的情况下运行脚本。到目前为止,我有这样的功能: if [ -z "$SLURM_JOB_ID" ] # Not running under SLURMso start the code witho
我是Slurm的新手,我也发现了有关这个话题的相关问题。然而,我仍然对如何使用srun的几点感到困惑。根据正式文档,srun通常首先分配资源,然后运行并行作业。例如,我可以简单地删除这个脚本中的srun命令。会发生什么呢?#SBATCH -n 1srun tar zxf julia-0.3.11.tar.gz
echo "prefix=/software/julia-0.3.11" > ju
我想通过提交一个独特的作业,使用SLURM对作业数组执行类似的(并行)运行。当一个任务完成时,我想启动第二次运行,它接收第一个任务生成的文件。有可能吗?我举了个例子。我想用$SLURM_ARRAY_TASK_ID=0,1,2运行3个并行任务。当单个任务完成时,例如srun ./my_program1.exe 0完成后,我想启动srun ./my_program1.exe $SLURM_ARRAY_TASK_ID
###something that tells to the machi