최근에 Hbase 및 hadoop 스택을 실험하기 시작했습니다. 나는 처음부터 응용 프로그램을 만들려고합니다. 나는 Google n-gram 데이터 세트를 사용할 응용 프로그램에 대한 스키마를 설계하고 있습니다.Hbase 스키마 디자인 - 제안 필요
데이터 세트를 ngram이 행 키로, 하나의 열 패밀리가 여러 한정자 (연도, 페이지 수, match_count)가있는 모델로 만들 수 있거나 모델이 n- 그램을 행 키로 가질 수 있다는 것을 알고 있습니다. Year, page_count, match_count에 대한 여러 열 패밀리.
이 데이터를 사용하는 방식에 따라 모델이 다르다는 것을 알고 있지만이 두 가지 방법의 장점과 단점을 이해하고 싶습니다.
건배, Dwarak