0
저는 HIVE 13.1을 광범위하게 사용해 왔으며 임팔라 2.5에서 제 일을하고 싶습니다. 임팔라에서는 현재 하이브의 어떤 기능을 사용할 수 없습니까? 워크 플로우를 하이브에서 임팔라로 전환 한 사람이 있습니까? 주목해야 할 것은 무엇입니까?임팔라는 하이브에게 어떤 기능을 제공하지 않습니까? Hive vs Impala
저는 HIVE 13.1을 광범위하게 사용해 왔으며 임팔라 2.5에서 제 일을하고 싶습니다. 임팔라에서는 현재 하이브의 어떤 기능을 사용할 수 없습니까? 워크 플로우를 하이브에서 임팔라로 전환 한 사람이 있습니까? 주목해야 할 것은 무엇입니까?임팔라는 하이브에게 어떤 기능을 제공하지 않습니까? Hive vs Impala
여기의 문제는 "기능상의 차이"자체가 아니라 사용 사례와 관련이 있다고 생각합니다.
임팩트는 단일 사용자가 실행하는 장기 실행 ETL 작업을 포함하므로 내결함성이 주요 요구 사항입니다. 임팔라는 하이브보다 몇 가지 장점을 제공합니다.
분석을 위해 동시 BI 스타일 쿼리를 작성하는 사용자가 여러 명 포함되어 있기 때문에 임펄라는 항상 하이브보다 빠릅니다.
그래서 두 가지 모두를위한 충분한 공간이 있습니다.
DATE 및 DECIMAL 데이터 형식 일부 ALTER 명령 * (그러나 Hive 셸에서이 명령을 실행할 수 있음) *. Hive는 항상 EXTERNAL 테이블의 새 파일을 확인하지만 임팔라는 캐시에 파일 및 블록 위치를 유지하므로 각 쿼리 전에 캐시를 강제로 새로 고쳐야합니다. –
물론 ORC, AVRO 등을 지원하지 않습니다. (모든 것을 마루로 만드십시오!) –
INSERT 명령으로 생성 된 파일 수에 대한 실질적인 제어는 없습니다. * 하이브에서는 #의 리 듀서를 조절하고 "병합"할 수 있습니다. 작은 파일 "속성) *. –