2016-11-27 3 views
0

HDInsight 클러스터로 외부 데이터 소스를 생성하려고합니다. 그렇게하는 동안 Hadoop, 이름, 노드, IP 주소 및 포트 번호와 같은 위치를 제공해야합니다.HDInsight로 외부 데이터 소스 생성

그래서 HDInsight 클러스터에서 이름, 노드, IP 주소, 리소스 관리자 위치, IP 주소 및 포트 번호를 어디에서 찾을 수 있습니까?

이미 Core-site.xml & yarn-site.xml으로 탐색했으며 HDInsight에 대해 아무 것도 발견하지 못했습니다.

--- 3 : 외부 데이터 원본 만들기 구문.

CREATE EXTERNAL DATA SOURCE MyHadoopCluster WITH ( 
    TYPE = HADOOP, 
    LOCATION ='hdfs://10.xxx.xx.xxx:xxxx', 
    RESOURCE_MANAGER_LOCATION = '10.xxx.xx.xxx:xxxx', 
    CREDENTIAL = HadoopUser1   
); 

- LOCATION (필수) : Hadoop 이름 노드 IP 주소 및 포트.
- 자원 관리자 위치 (선택 사항) : 푸시 다운 계산을 사용하기위한 Hadoop Resource Manager 위치입니다.
- CREDENTIAL (선택 사항) : 위에 작성된 데이터베이스 범위 자격 증명.

감사합니다.

답변

2

질문을 올바르게 이해했다면 이미 HDInsight 클러스터가 있고 외부 테이블을 통해 Azure SQL DW와 대화하려고합니다. "Azure SQL 데이터웨어 하우스"에 대해 CREATE EXTERNAL DATA SOURCE 문서의 구문 섹션을 검색하면 현재 Azure SQL DW의 Polybase가 Azure Blob 저장소와 대화하는 유일한 방법이 표시됩니다. (Azure의 Polybase에서 Polybase로 계속 조정하면 계속 향상됩니다.)

이제는 Hive에 정의 된 외부 테이블에 HDInsight 쓰기를 수행 한 다음 Azure를 사용해야합니다 SQL DW는 blob 저장소의 동일한 폴더를 가리키며 해당 BLOB를 읽는 자체 외부 테이블을 선언합니다.