2016-12-16 11 views
0

아파치 드릴 쿼리를 사용합니다. 별도의 쿼리를 위해 데이터를 검색 할 수 있습니다.여러 디렉토리에 대한 Apache 드릴 쿼리

내가 필요한 것은 폴더의 여러 파일에 대한 결과를 얻는 것입니다. 데이터를 재귀 적으로 얻거나 아파치 드릴에서 교차 결합을 사용하는 방법이 있습니까?

답변

0

쿼리 디렉토리 : 사용하는 대신

use dfs.`/user/dev/data` 
select * from sample.file1 
select * from sample.file2 

:

select * from <dir> 

sample.file1sample.file2

/home/dev/data는 현재 당신이 좋아하는 일을하고 있습니다에

use dfs.`/user/dev` 
select * from data 
+0

덕분에 동일한 디렉토리에있는 파일에 적용됩니다. –

0

다른 계층 구조의 여러 폴더에서 데이터를 검색 할 수있는 솔루션을 발견했습니다.

계층 구조는 다음과 같습니다.

| - mainFolder 
| - | - folder1 
| - | - | - sample1.json 
| - | - | - sample2.json 
| - | - | - folder2 
| - | - | - | - sample4.json 
| - | - folder3 
| - | - | - sample5.json 
| - | - | - sample6.json 

모든 파일의 모든 데이터를 가져 오려면;

SELECT * FROM mainFolder.* WHERE dir0=‘folder1' or dir0=‘folder3' or dir1=‘folder2'; 

"dir"다음의 숫자는 계층 구조의 수준을 나타냅니다. 폴더 경로를 지정할 필요가 없습니다. 지정된 레벨의 모든 폴더를 개별적으로 검사합니다. 폴더 2에서 데이터를 가져 오는 데는 dir1='folder2'이면 충분합니다.