2014-11-26 3 views
3

SGE 클러스터에서 작업 중이며 qsub 전자 메일 알림 시스템에 문제가 있습니다. 모든 작업이 완벽하게 작동하지만 중단 된 작업에서만 알림을 보내도록 기본 동작을 수정할 수없는 것처럼 보입니다. -M 플래그가 올바르게 작동하고 작업이 중단되면 전자 메일을 수신하지만 작업이 시작, 종료, 중단 또는 일시 중단 될 때 전자 메일을 보내려합니다. 스크립트에서 다음 플래그를 사용하고 있습니다. 누락 된 바보 같은 것이 있습니까?SGE 클러스터 qsub 전자 메일 알림이 작동하지 않습니다.

#!/bin/bash 
#$ -S /bin/bash 
#$ -M [email protected] 
#$ -m beas 

program 

나는 다음과 같은 시도 할 때 그것은 또한 작동하지 않습니다

qsub -M [email protected] -m baes script.sh 

이 내 클러스터에 sys 관리자와 함께해야, 아니면 잘못 짓을 한 문제인가?

도움 주셔서 감사합니다.

답변

3

이 문제를 해결하는 데 중요한 점은 작업이 실행되는 노드가 작업 상태 전자 메일을 보내야한다는 것입니다. 예를 들어, 다음과 같은 출력을 가진 테스트 작업이 있습니다.

#!/bin/bash 
# 
#$ -N MAIL 
#$ -j y 
#$ -m easb 
#$ -M pkenyon 

hostname 

이제 작업을 실행하고 실행 된 부분을 확인하십시오.

[[email protected] ~]$ qsub mail.sh 
Your job 346 ("MAIL") has been submitted 
[[email protected] ~]$ cat MAIL.o346 
node03.cluster 

시스템의 메일 로그를 보면 전달 시도가 표시됩니다. 거기서 진단해야합니다.

  • 는 계산 노드 주소로 전송, -M pkenyon

    ... 
    Jun 5 13:56:00 node04 postfix/local[13141]: 14A3E143320: to=<[email protected]>, orig_to=<pkenyon>, relay=local, delay=0.05, delays=0.03/0/0/0.01, dsn=2.0.0, status=sent (delivered to mailbox) 
    ... 
    
  • 사용 : 여기에 (길에서 성공하지 않거나 심지어 성공 당신이 그들이 원하는) 오류에 대한 몇 가지 예입니다 헤드 노드 MX는를 사용하는 경우 로컬 메일 릴레이를 사용하도록 시스템을 설정해야

  • -M [email protected]

    ... 
    Jun 5 14:00:30 node04 postfix/smtp[13283]: 35CC4143320: to=<[email protected]>, relay=none, delay=0.36, delays=0.17/0/0.19/0, dsn=5.4.4, status=bounced (Host or domain name not found. Name service error for name=head.cluster type=AAAA: Host not found) 
    ... 
    
  • 사용 권한을 설정하지

... 
Jun 5 12:20:47 node04 postfix/smtp[12798]: 1EEA5143320: to=<[email protected]>, relay=ASPMX.L.GOOGLE.com[64.233.168.27]:25, delay=0.64, delays=0.04/0/0.59/0.02, dsn=5.0.0, status=bounced (host ASPMX.L.GOOGLE.com[64.233.168.27] said: 550 Relay not permitted (in reply to RCPT TO command)) 
... 
는 그래서 그래, 당신은 당신의 클러스터 시스템 관리자에게 이야기해야하지만이는 SGE 이메일가 걸려있다 곳을 파악하는 첫 번째 단계입니다. 정보가 조금 있으면 관리자는 구성 문제를 해결하고 클러스터 환경을 최대한 활용할 수 있습니다.

+0

큰 충고 폴 폴은 분명히 나에게 뭔가를 줄 것이다. –