2017-03-13 3 views

답변

2

srun 명령 끝에 || scontrol requeue $SLURM_JOB_ID을 추가하여 실패한 경우 0이 아닌 출력 코드를 반환하면 작업이 다시 큐에 추가되고 다시 예약됩니다. $SLURM_RESTART_COUNT으로 재시작 횟수를 추적 할 수 있습니다.