2017-11-28 9 views
0

나는 모든 문자열이므로 치수로 선호합니다. 하지만 특정 차원의 개수에 대한 연간, 월별 및 일별 데이터에 대한 그룹 별 쿼리를 실행하고 싶습니다.druid가 치수 기반 데이터에 적합합니다.

내 시스템은 약 5cr 데이터를 생성합니다.

드루이드를 사용하는 것이 좋습니다. 이 유형의 no-SQL 데이터에 사용할 수있는 다른 적합한 데이터베이스가 있습니까? 스키마 구조와 접근 방식이 얼마나 좋을까요?

답변

0

Druid는 필터 및 집계 데이터를위한 다중 차원입니다. 귀하의 경우에는 druid를 사용하는 것이 좋지만 적절한 스키마를 정의해야한다는 점에 우려하십시오. 나이를 포함하는 연령대를 필터링하려면 연령대가 포함되어 있고 노출 수를 측정하려면 노출 수를 포함하는 측정 항목입니다. 스키마를 구체적으로 지정해야하며 설계시주의해야합니다. druid에 대한 우려는 초당 데이터 소스에 대한 질의를위한 시간이지만, 섭취 데이터의 시간은 시간 소모적 인 과정입니다. 클러스터 구성이 필요합니다. 데이터를 입력 할 때 차원 또는 측정 항목의 값을 처리 된 데이터 소스로 업데이트 할 수 없습니다.