druid

    1

    1답변

    우리는 1 초에 약 800 만 행의 거대한 데이터를 가지고 있습니다. 각 행에는 12 개의 숫자 값 (타임 스탬프, 정수 및 부동 소수점이 있지만 텍스트는 없음)이 있습니다. 스트리밍 삽입물을 찾고 있지만 속도를 얻을 수 있다면 대량 삽입물로 관리 할 수 ​​있습니다. 쿼리 : 기본적으로 쿼리는 집계입니다. 나는 드루이드을 보았지만, 절대적으로 우리에게 필

    0

    1답변

    드루이드 (druid)에 대한 섭취가 원활하지 않습니다. 상황은 org.apache.hadoop.mapred.LocalJobRunner -지도 작업 실행자가 완료된 후에 휴식을 시작합니다. 그것은 입력 파일을 가져올 수 있습니다. 내 사양의 JSON 파일 - { "hadoopCoordinates": "org.apache.hadoop:hadoop-c

    0

    1답변

    는 드루이드 데이터 일반적으로 timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2 는 실시간 노드와 몇 가지 규칙에 따라 역사 노드에로드 할 수있는 형태의 원시 이벤트 (드루이드 용어로 알파 세트)를 고려한다. 이러한 규칙은 시간 범위와 관련이있는 것 같습니다. 예컨대 : 상자에

    -1

    1답변

    아파치 스파크를 사용하여 실시간 데이터를 분석해야했던 유스 케이스가 있습니다. 하지만 여전히 내 응용 프로그램에 대한 데이터 저장소를 선택하는 것과 관련된 혼란이 있습니다. 분석에는 주로 집계, KPI 기반 신원 분석 및 경향 및 분석을 예측하는 기계 학습 도구가 포함됩니다. 카산드라 (Cassandra)는 훌륭한 지원을하고 있으며 대기업의 기술 회사는 이

    2

    1답변

    히스토리 노드에 약 10GB의 데이터가 저장되어있다. 그러나 해당 노드의 메모리 사용량은 약 2GB입니다. select 쿼리를 실행하면 결과가 처음 30 초 이상 반환됩니다. 다음으로 그들은 (브로커 캐쉬로 인해) 2 위를 차지합니다. 제 관심은 처음으로 쿼리를 1 초로 줄이는 것입니다. 이러한 성능을 달성하려면 역사적인 노드가 모든 데이터를 메모리에 저장

    1

    1답변

    아래의 json을 사용하여 druid 데이터 소스의 모든 데이터를 읽습니다. 그러나 요청 임계 값 필드/값은 필수 항목입니다. 임계 값에 지정된 행 수를 반환합니다. { "queryType" : "select", "dataSource" : "wikiticker", "granularity" : "day", "interval

    1

    2답변

    드루이드 성능 테스트 중에 흑연의 특정 드루이드 메트릭을 수집하기 위해 druid에서 흑연 이미 터 플러그인을 시험 중입니다. 그런 다음 배치 성능을 특성화하기 위해 흑연에서 제공하는 REST API를 사용하여 이러한 메트릭을 쿼리합니다. 그러나 그래파이트가 반환하는 숫자는 의미가 없습니다. 그래서 결과를 올바른 방식으로 해석하는지 확인하고 싶었습니다. 카

    1

    1답변

    나는 워드 프로세서를 다음과 편집 : druid-0.9.2/conf/druid/_common/common.runtime.properties 및 추가하십시오 druid.extensions.loadList에 "druid-kafka-indexing-service" 를 다시 시작하는 모든 드루이드 서비스 : middlemanager, overlord, co

    0

    1답변

    내 Druid 데이터 소스에서 필드 중 하나에 hyperUnique 집계 (처리 시간)가 있습니다. COUNT(DISTINCT(<hyperunique_field>))과 동일한 조치를 취하려고합니다. 방해석 드루이드 어댑터에서 지원됩니까? 그렇다면 올바른 방법은 무엇입니까? 합판에서는 COUNT_DISTINCT을 할 수 있습니다. 이것을 실행하면 0이 반환됩

    1

    1답변

    찾았 음 : curl: (7) Failed to connect to localhost port 8090: Connection refused. 그러나 문제를 해결할 수는 없습니다. 내 컴퓨터의 공개 IP를 사용했지만 다른 오류가 발생했습니다. "curl : (52) Empty reply from server". 나는 또한 다른 게시물에서 언급했듯이 0.0.0