1
흑연을 사용하여 일부 메트릭을 수집하고 있지만 때로는 데이터가 들어오지 않습니다 (아마도 서버가 다운되었거나 네트워크에 연결되어 있지 않기 때문일 수 있습니다). 나기 오스가 그런 사건 중에 나에게 경보를 보내길 바란다. 어떻게해야합니까?그래파이트가 데이터를 가져 오지 않을 때 나기 오스 경고를 보내십시오.
흑연을 사용하여 일부 메트릭을 수집하고 있지만 때로는 데이터가 들어오지 않습니다 (아마도 서버가 다운되었거나 네트워크에 연결되어 있지 않기 때문일 수 있습니다). 나기 오스가 그런 사건 중에 나에게 경보를 보내길 바란다. 어떻게해야합니까?그래파이트가 데이터를 가져 오지 않을 때 나기 오스 경고를 보내십시오.
nagios-plugins의 check_file_age 스크립트를 사용하여 데이터를 수집 할 시스템 당 알려진 단일 데이터 포인트를 확인할 수 있습니다.
check_file_age -w 600 -c 1800 /opt/graphite/storage/whisper/servers/$(uname -f)/cpu/idl.wsp
5 분 이내에 특정 측정 항목이 누락 되었다면 알려줍니다. 그렇지
당신은 모든 지점을 통해 find 명령을 실행, n은 시간에 업데이트되지 않은 그 어떤을보고 할 수 있습니다.
#!/bin/bash
OLD_GRAPHS=$(find /opt/graphite/storage/whisper -mmin +120 -type f | wc -l)
if [[ OLD_GRAPHS -gt 0 ]];then
echo "Found ${OLD_GRAPHS} graph(s) without an update in 120 minutes"
exit 1
fi
echo "All graphs are up to date"
exit 0
이 솔루션이 효과가 있다고 생각하지만 문제가 발생했습니다. 명령을 수동으로 실행하면 작동합니다. 그러나 Nagios는 약간의 오류를주고 있습니다. 이것은 로그에서 얻은 것입니다 - Embedded Perl은/usr/lib/nagios/plugins/check_file_age를 실행했습니다 : 리턴 코드 = 2, 플러그인 출력 = FILE_AGE CRITICAL : 파일을 찾을 수 없음 - -w \ n – user3465593