2017-12-07 14 views
1

시스템에서 처리 한 요청에 대한 백분율 오류율을 기반으로 bosun 경고를 작성하는 경우 낮은주기를 처리하는 방법으로 작성합니다 교통. 예를 들어트래픽 양이 적음을 처리하는 bosun 경고를 작성하는 방법

다음 ERRORRATE이 사전 정의 된 임계 값 crit = $errorRate > 0.05를 초과하는 경우 I는 최근 5 분 동안 다시보고 요청 $errorRate = $numberErr/$numberReq에 대한 오류 비율을 작동 한 후 알람을 트리거 경고가있는 경우 이 아주 잘 그래서 작업 할 수 있습니다 5 분마다 요청 수가 충분히 많습니다 ($numberReq).

5 분 동안의 요청 수가 10,000이면 경보를 트리거하는 데 501 오류가 필요합니다. 그러나 5 분 동안의 요청 수가 100이면 경보를 발생시키는 데 5 개의 오류 만 필요합니다.

요청 수가 너무 적어 오류 수가 적을 때 오류 비율이 큰 기간을 처리하는 경고를 작성하려면 어떻게해야합니까? 나는 요청의 수가 알람에 대한 확신을 줄 때까지 창 크기가 증가하는 고정 된 5 분이 아닌 슬라이딩 윈도우를 고려했습니다. 예 : 요청 수가 10,000 개가 될 때까지 시간을 늘리십시오.

나는 bosun에서 이것을 달성 할 수있는 방법을 찾을 수 없으며, 트래픽 속도가 너무 다양하기 때문에 경고에 더 많은 시간을 투자하고 싶지 않습니다. 트래픽이 극심한 기간이 길면 실제 오류가 발생하여 큰 영향을 줄 수 있습니다.

답변

0

일반적으로 모든 백분율 및/또는 내역 기반 알림을 정적 임계 값과 연결합니다.

예 : crit = numberErr > 100 && $errorRate > 0.05. 그 방법은 전체 진술이 사실이 아니기 때문에 오류 수가 또한 임계 값을 넘지 않는 한 문제가되지 않습니다.

+0

그러나 이렇게하면 응답 시간을 늘리지 않고 요청 수가 너무 낮을 때 알람을 오랫동안 사용할 수 없게됩니다. –

+0

@CraigWarren 알겠습니다. 더 잘 이해합니다. 대답은 즉시 나에게 명백하지 않다. 어쩌면'crop'과 몇몇 불리언 조건들을 사용함으로써 달성 될 수 있지만 그것과 함께해야 할 것이다. –