slurm

    1

    1답변

    동일한 모델 (블랙 박스)의 300 개의 작업을 실행해야합니다. 그러나 때로는 세그먼트 오류는 다음과 같은 오류 메시지와 함께 모델 내부에서 발생 srun: error: nodexyz: task 0: Segmentation fault 클러스터는 자원 관리자로 SLURM을 사용하고 난 실패하면 자동으로이 작업을 다시 대기하고 싶다.

    1

    1답변

    모든 SLURM 노드를 유지 관리 준비를 위해 "배수"로 설정 한 다음 노드가 재개 될 때까지 모든 새 작업이 보류 상태를 유지합니다. 유지 관리 창 전에이 작업을 수행하므로 모든 실행중인 작업이 완료 될 수 있습니다. 그건 꽤 많은 클러스터 시간을 낭비합니다. 이 주어진 시간보다 짧아 지도록 노드가 --time=x 인수와 함께 배치 작업 만 수락하도록 지

    5

    2답변

    SLURM에서 여러 작업을 대기 중입니다. slurm에서 병렬 실행 작업 수를 제한 할 수 있습니까? 미리 감사드립니다.

    0

    1답변

    나는과 같이 표준 SLURM 제출을 사용하여 스크립트를 제출 마스터 스크립트가 : 실행시 cat > $jobfile <<EOF #!/bin/bash # auto-generated job file # generated from $PWD/$0 # on ${DATE} #SBATCH --job-name=PAINT

    1

    1답변

    우리는 공유 컴퓨터에서 대기열 작업에 SLURM을 사용하고 있습니다. 요청한 스레드 수에 따라 작업의 스레드 사용률을 어떻게 제한합니까? 현재로서는 정직하게 생각하고 있으며 사용자는이 사실을 악용하여 대기열을 뛰어 넘습니다.

    1

    1답변

    현재 프로젝트에서 나는 slurm multiprog conf (256 글자의 한계가있다)에 명령어가 너무 길다는 문제가있다. 이 문제를 해결하려면 배치 파일에 변수 (경로, 사용자 데이터, 파일 이름)를 정의하고 multiprog 구성 파일에서 사용하고 싶습니다. 아줌마 구글과 오히려 스파르타의 문서는 나에게 힌트를주지 않았다. 환경 변수를 살펴 보았지만

    1

    1답변

    표준 통계 시뮬레이션을 실행 중입니다. 100 개의 배열 노드 중에서 10000 개의 반복 (각각 다른 랜덤 시드가 있음). 저는 과거에도 여러 번 해봤지만 항상 원하는 결과를 얻었습니다.하지만 이번에는 모두 100 개의 노드가 모두 동일한 임의의 시드를 가진 것처럼 똑같은 결과를 산출했습니다. LSF에 미묘한 무언가가있어 모든 것을 같은 씨앗으로 만들 수

    0

    1답변

    일부 작업이 sbatch로 시작되었습니다. c=$(sbatch --dependency=afterany:$a:$b ...) 어떻게 C의 스크립트 작업 A와 B의 종료 상태를 전달할 수 있습니다 : A 또는 B 완료 후 a=$(sbatch ...) b=$(sbatch ...) 지금 세 번째 작업은 대기?

    0

    1답변

    SLURM에서 sacct 명령의 JobName 열에 사용 된 문자 수를 확장 할 수 있습니까? JobID JobName Elapsed NCPUS NTasks State ------------ ---------- ---------- ---------- -------- ---------- 12345 lengthy_na+ 00:00:01 4 1

    0

    1답변

    나는 phylip 파일마다 하나의 나무를 만들기 위해 RAxML이라는 계통 발생 소프트웨어를 사용하고 있습니다. 3 개의 phylip 파일이있는 디렉토리의 경우 다음을 수행했습니다. ##files in directory Ortho1.phy Ortho6.Phy Ortho6.Phy for f in /home/Single_trees/trimmed_align