2015-01-25 6 views
0

임팔라를 4 개월 이상 사용 해왔고 대부분의 경우 하이브에 비해 매우 빠른 것으로 나타났습니다. 데이터 처리를 위해 Hadoop의 빠른 프레임 워크를 평가하는 과정에 있기 때문에 임팔라보다 빠른 기본 Hadoop 환경에서 더 이상 프레임이 작동하는지 알기를 원합니다 (모든 유형, 메모리 또는 MR1 또는 원사 기반 일 수 있음). !) 포괄적 인 목록이 도움이 될 것입니다.Hadoop 스택의 임팔라에 비해 빠른 기술?

답변

0

임팔라는 속도 측면에서 좋은 선택입니다. 표준 Map/Reduce 환경에서는 더 나은 캐시를 찾을 수 없습니다. 임팔라는 디스크에서 캐시되지 않은 블록을 읽는 경우에도 데이터 블록을 캐시 할 수 있으며 M/R보다 훨씬 빠릅니다. 물론 임팔라에 대한 수개월의 경험이 있음을 이미 알고 있습니다. AFAIK에는 네이티브 hadoop 구조를 사용하는 실시간 하이브 접근 메커니즘이 거의 없습니다.