2017-04-14 4 views
1

저는 MVA "Azure Data Lake 소개"과정을 거치며, 모듈 2까지, 강조 표시되는 각 비디오 테이블에서 작업을 수행하는 데 걸리는 시간에만 비용을 지불하고 있습니다.애저 데이터 레이크 스토어는 애널리틱스 데이터를 일시적 용도로만 사용합니까?

Google의 모든 거래 내역 데이터에 영구적으로 데이터를 저장하는 경향이 있거나 해당 데이터가 일시적으로 트랜잭션의 부분을 분석하고 분석을 통해 계산 한 후이를 의미하는 경우 혼란을 느낍니다. 즉 USQL, HIVE, PIG를 실행하고 임시 분석 소스를 삭제합니다. 즉

:

은 그것의 임시 또는 준비 테이블 & 분석 데이터를 생성 및 통계의 결과 후 테이블을 삭제입니다. 또는 데이터 호수는웨어 하우스와 같은 미래의 사용을 위해 데이터를 저장하고 비즈니스 요구 사항 에 따라 분석을 수행하기위한 것이지 그 스토리지에 많은 비용이 소요되지 않습니다. 당신은 (출력 문 또는 테이블에 삽입하여, 예를 들면)에 ADL 스토리지 계정에로드하거나 U-SQL 또는 하이브 작업과 쓰기

감사 Harsimran

+0

필자의 이해를 충분히 설명하지 못하는 의견으로 제공합니다. (수정 된 경우 기꺼이 충분할 것입니다.) - 데이터는 항상 ADL에 저장되며 ADLA에서는 작업을 생성하고 실행합니다. 작업은 ADL에서 데이터를 가져옵니다 (우리는 데이터를 가져와야하는 위치에서 파일의 경로를 언급합니다). 그들은 ADLA를 '서비스로서의 직업'이라고 부르는 것을 기억하십시오. – Abhishek

+0

그래서 스토리지는 비용이 들며 궁극적으로 얼마나 많은 클러스터 또는 공간이 사용 되는가에 달려 있다는 뜻입니까? –

답변

2

데이터는 ADL에 저장됩니다 스토리지 계정에 저장하고 공간을 사용합니다. ADLS 계정의 공간은 클러스터 크기에 영향을받지 않으며 수요가 증가함에 따라 커집니다.