2016-08-25 2 views
0

저는 HIVE 13.1을 광범위하게 사용해 왔으며 임팔라 2.5에서 제 일을하고 싶습니다. 임팔라에서는 현재 하이브의 어떤 기능을 사용할 수 없습니까? 워크 플로우를 하이브에서 임팔라로 전환 한 사람이 있습니까? 주목해야 할 것은 무엇입니까?임팔라는 하이브에게 어떤 기능을 제공하지 않습니까? Hive vs Impala

+0

DATE 및 DECIMAL 데이터 형식 일부 ALTER 명령 * (그러나 Hive 셸에서이 명령을 실행할 수 있음) *. Hive는 항상 EXTERNAL 테이블의 새 파일을 확인하지만 임팔라는 캐시에 파일 및 블록 위치를 유지하므로 각 쿼리 전에 캐시를 강제로 새로 고쳐야합니다. –

+0

물론 ORC, AVRO 등을 지원하지 않습니다. (모든 것을 마루로 만드십시오!) –

+0

INSERT 명령으로 생성 된 파일 수에 대한 실질적인 제어는 없습니다. * 하이브에서는 #의 리 듀서를 조절하고 "병합"할 수 있습니다. 작은 파일 "속성) *. –

답변

0

여기의 문제는 "기능상의 차이"자체가 아니라 사용 사례와 관련이 있다고 생각합니다.

임팩트는 단일 사용자가 실행하는 장기 실행 ETL 작업을 포함하므로 내결함성이 주요 요구 사항입니다. 임팔라는 하이브보다 몇 가지 장점을 제공합니다.

분석을 위해 동시 BI 스타일 쿼리를 작성하는 사용자가 여러 명 포함되어 있기 때문에 임펄라는 항상 하이브보다 빠릅니다.

그래서 두 가지 모두를위한 충분한 공간이 있습니다.