2017-02-22 8 views
1

드루이드 성능 테스트 중에 흑연의 특정 드루이드 메트릭을 수집하기 위해 druid에서 흑연 이미 터 플러그인을 시험 중입니다. 그런 다음 배치 성능을 특성화하기 위해 흑연에서 제공하는 REST API를 사용하여 이러한 메트릭을 쿼리합니다.druid 흑연 이미 터 확장 사용

그러나 그래파이트가 반환하는 숫자는 의미가 없습니다. 그래서 결과를 올바른 방식으로 해석하는지 확인하고 싶었습니다.

카프카 인덱싱 서비스는 드루이드로 카프카의 데이터를 섭취하는 데 사용됩니다

  • 설정.
  • 흑연 이미 터를 사용하도록 설정했으며 수집 할 수있는 측정 항목의 화이트리스트를 제공했습니다.
  • 그런 다음 색인이 생성되는 카프카 항목에 5000 개의 이벤트가 전달되었습니다. 카프카 관련 도구를 사용하여 메시지가 실제로 카프카 로그에 저장되어 있음을 확인했습니다.

컬 "http://Graphite_IP:Graphite_Port> /render/?target=druid.test.ingest.rows.output & CSV 형식 ="

:
  • 다음에, I는 다음의 콜을 이용하여 흑연의 ingest.rows.output metric 검색된
  • :
    • 에 따라 내가 가진 결과는 617,451,515,
      druid.test.ingest.rows.output,2017-02-22 01:11:00,0.0 
      druid.test.ingest.rows.output,2017-02-22 01:12:00,152.4 
      druid.test.ingest.rows.output,2017-02-22 01:13:00,97.0 
      druid.test.ingest.rows.output,2017-02-22 01:14:00,0.0 
      

    나는이 숫자를 해석해야할지 모르겠 : 숫자 152.4 및 출력에 97.0이 표시하는 일

    질문

    1. ?
    2. 152.4와 같이 '행 수'를 부동 소수점 값으로 사용할 수 있습니까?
    3. 이 번호는 내가 밀어 넣은 '5000'메시지와 어떤 관련이 있습니까 카프카? 사전에

    감사합니다,

    Jithin 드루이드 측정 page 당으로

    답변

    0

    몇 가지 실험을 통해 문제를 파악했습니다. 카프카 주제에는 여러 개의 파티션이 있으므로, druid는 카프카 데이터를 색인하기 위해 여러 작업을 실행합니다 (파티션 당 하나의 작업). 이러한 각 태스크는 정기적 인 간격으로 다양한 메트릭을보고합니다. 각 메트릭에 대해 각 시간 간격에 대한 흑연에서 얻은 숫자는 해당 간격의 메트릭에 대한 모든 작업에서보고 한 값의 평균입니다.위의 경우, 집계 함수가 합계 (평균 대신) 인 경우 흑연에서 얻은 값은 5000이었습니다.

    그러나 평균화가 graphite-emitter druid로 수행되는지 여부를 파악할 수 없었습니다 플러그인 또는 흑연.

    0

    그것은 롤업 후 이벤트의 수를 나타냅니다. 관찰 된 부동 소수점 값은 흑연 서버가 데이터를 요약하는 데 사용하는 기간 창에 대한 평균을 계산하기 때문입니다. 그런 메트릭이 완료되면 초기 5000 행이 약 250 행으로 압축되었음을 의미합니다.

    +0

    그래파이트 수가 평균 인 경우 총 행 수는 두 숫자 (즉, 250)의 합계가 될 수 있습니다. 또한, 평균 수량은 얼마입니까? – jithinpt