많은 유니온 모든 연산자를 사용하여 쿼리를 사용하여 마루 저장 형식으로 된 파티션 된 하이브 테이블을 채우는 중입니다. 쿼리는 Tez을 사용하여 실행됩니다. 기본 설정을 사용하면 여러 개의 동시 Tez 작성자가 HDFS 구조를 생성합니다. 여기서 마루 파일은 파티션 폴더 아래의 하위 폴더 (폴더 이름의 Tez 작성자 ID)에 있습니다. 예. /apps/hive/warehouse/scratch.db/test_table/part=p1/8/000000_0임팔라 2.7 하이브에서 Tez 함께 만든 쪽 마루 탁자에서 데이터를 읽지 못했습니다
메타 데이터를 무효화하고 테이블에서 통계를 수집 한 후에도 임팔라는 테이블을 쿼리 할 때 0 행을 반환합니다. 임팔라가 파켓 파일을 찾기 위해 파티션 하위 폴더로 이동하지 않는 것으로 보입니다.
hive.merge.tezfiles를 true로 설정하면 (기본적으로 false 임) Tez이 여러 파일을 하나의 파일로 병합하기 위해 추가 처리 단계를 사용하도록 강제 설정하면 결과로 생성되는 여기 엔 나무 마루 파일이 파티션 폴더 바로 아래에 쓰여지고 새로 고침 임팔라는 새 파티션이나 업데이트 된 파티션에서 데이터를 볼 수 있습니다.
임팔라가 파티션 하위 폴더를 보도록 지시하는 설정 옵션이 있는지 궁금하거나 임팔라 용 패치가있을 수 있습니다.
안녕 Sokhaty와 하위 디렉토리 검색을 했 지원? –
글쎄, 그 노력에 감사하지만, 이미 임팔라에 의해 상자 밖으로 지원되지 않았습니다 알아 냈어. 제 질문은 Impala가 하위 폴더를 인식하도록하기위한 추가 옵션 및 수정 사항이 있다는 것입니다. – sokhaty
현재 impala에서는 수정할 수 없습니다. –