아파치 드릴 쿼리를 사용합니다. 별도의 쿼리를 위해 데이터를 검색 할 수 있습니다.여러 디렉토리에 대한 Apache 드릴 쿼리
내가 필요한 것은 폴더의 여러 파일에 대한 결과를 얻는 것입니다. 데이터를 재귀 적으로 얻거나 아파치 드릴에서 교차 결합을 사용하는 방법이 있습니까?
아파치 드릴 쿼리를 사용합니다. 별도의 쿼리를 위해 데이터를 검색 할 수 있습니다.여러 디렉토리에 대한 Apache 드릴 쿼리
내가 필요한 것은 폴더의 여러 파일에 대한 결과를 얻는 것입니다. 데이터를 재귀 적으로 얻거나 아파치 드릴에서 교차 결합을 사용하는 방법이 있습니까?
쿼리 디렉토리 : 사용하는 대신
use dfs.`/user/dev/data`
select * from sample.file1
select * from sample.file2
:
select * from <dir>
말 sample.file1
및 sample.file2
는
/home/dev/data
는 현재 당신이 좋아하는 일을하고 있습니다에
use dfs.`/user/dev`
select * from data
다른 계층 구조의 여러 폴더에서 데이터를 검색 할 수있는 솔루션을 발견했습니다.
계층 구조는 다음과 같습니다.
| - mainFolder
| - | - folder1
| - | - | - sample1.json
| - | - | - sample2.json
| - | - | - folder2
| - | - | - | - sample4.json
| - | - folder3
| - | - | - sample5.json
| - | - | - sample6.json
모든 파일의 모든 데이터를 가져 오려면;
SELECT * FROM mainFolder.* WHERE dir0=‘folder1' or dir0=‘folder3' or dir1=‘folder2';
"dir"다음의 숫자는 계층 구조의 수준을 나타냅니다. 폴더 경로를 지정할 필요가 없습니다. 지정된 레벨의 모든 폴더를 개별적으로 검사합니다. 폴더 2에서 데이터를 가져 오는 데는 dir1='folder2'
이면 충분합니다.
덕분에 동일한 디렉토리에있는 파일에 적용됩니다. –