2017-05-16 5 views
0

우리는 U-SQL 테이블로 작업하고 있으며 클러스터 된 인덱스와 관련된 질문이 있습니다. U-SQL 테이블에서 병렬 처리는 데이터가 분할되고 분산되는 방식으로 관리됩니다. Clustered Index는 U-SQL 테이블에서도 병렬 처리에 영향을 줍니까? 둘째, 분산 물통에서 데이터 비뚤어 짐을 어떻게 관리합니까?U-SQL 테이블의 클러스터 된 인덱스가 병렬 처리에 영향을 줍니까?

답변

0

클러스터 된 인덱스는 병렬 처리 자체에 영향을 미치지 않지만 쿼리 조건부에 따라 인덱스 검색 또는 인덱스 검색을 사용하여 데이터를 읽는 경우 영향을 줄 수 있습니다. 따라서 정점 내부의 데이터에 액세스하는 성능에 영향을줍니다.

데이터 비대칭은 관리되지 않습니다. 왜곡이있는 경우 더 나은 배포 키를 찾고 Skewfactor 힌트를 사용하거나 ROUND ROBIN 배포를 사용해야합니다.