documentDB를 Azure Data Lake Storage로 옮기는 것이 가장 좋은 방법인지 궁금합니다. 컬렉션의 각 문서에 대한 파일을 만들거나 전체 documentDB를 이동해야합니까? 또한 U-SQL을 사용하여 documentDB에 액세스하는 방법에 대한 많은 정보를 찾지 못했습니까?DocumentDB 컬렉션을 Azure로 이동하기 Data Lake Storage
입력 하시겠습니까?
documentDB를 Azure Data Lake Storage로 옮기는 것이 가장 좋은 방법인지 궁금합니다. 컬렉션의 각 문서에 대한 파일을 만들거나 전체 documentDB를 이동해야합니까? 또한 U-SQL을 사용하여 documentDB에 액세스하는 방법에 대한 많은 정보를 찾지 못했습니까?DocumentDB 컬렉션을 Azure로 이동하기 Data Lake Storage
입력 하시겠습니까?
현재 DocumentDB (또는 현재 CosmosDB)의 데이터에 액세스하는 데 U-SQL을 사용할 수 없습니다. 기능 요청은 here입니다. 언제든지 투표를하십시오.
데이터를 이동하는 경우 조직은 데이터를 관리하는 방법 (전체 삭제 또는 부분 만), 구조화 방법 (동일한 구조의 데이터를 같은 파일 또는 동일한 폴더) 그리고 그것을 사용하는 방법 (항상 모든 것이 필요합니까? 아니면 부분 만 필요합니까?) 그리고 가장 좋은 성능을 제공하는 것은 무엇입니까? (대용량 파일은 일반적으로 더 좋지만, JSON이라면 추출 프로세스가 제대로 작동하는지 확인하십시오).
나는 이것을 왜하고 싶은지 물어볼 필요가있다. DocDB와 ADL은 다른 목적을위한 다른 도구입니다. 이것은 영구적 인 움직임인가? 또는보고를 위해 데이터를 ADL에 복사하고 싶습니까? 그렇다면 데이터 호수 분석 서비스 내에서 테이블 사용을 고려해 보셨습니까? –
간단히하기 위해 ADL로 보내지는 여러 로그 파일이 있습니다. 나는 또한 각각의 파일에 대한 추가 정보를 담고있는 documentDB를 가지고있다. (왜 그런지 묻지 않는다. 따라서 각 로그 파일에는 일치하는 documentdb 문서가 있습니다. documentDB는 ADL에 json 파일로 저장됩니다. json 파일을 쿼리 할 수 있지만 documentDB로 저장하지 않고 직접 쿼리 할 수 있습니다 (인덱스로 더 좋을 것 같습니다). – reachify