2011-12-01 2 views
1

하둡은 주로 비 구조적 또는 반 구조적 데이터를 처리하는 데 사용됩니다. 많은 양의 구조화 된 데이터를 처리하기 위해 Hadoop을 사용하고 싶습니다.하둡 및 RDBMS

hadoop은 DBInputFormat을 통해 데이터베이스에서 읽을 수 있지만 데이터베이스 연결 수가 제한되어 있으므로 확장 가능한 접근 방식으로 간주되지 않습니다.

누가 hadoop을 사용하여 RDBMS에서 데이터를 읽었습니까? 공연은 무엇 이었습니까? 얼마나 많은 노드를 지원할 수 있습니까?

감사

답변

0

당신은 하둡에 RDBMS에서 데이터를 가져올 Sqoop를 사용할 수 있습니다.

제약 조건 (구조화 된 데이터 생성)을 끝까지 밀어 내기 때문에 비정형 데이터 처리시 Hadoop이 빛납니다. 또한 추출 할 수있는 정보의 종류를 정의 할 수있는 구조에 대한 창의성을 허용합니다.

구조화 된 데이터를 처리 할 수는 없지만 얻은 마일리지는 낮지 않습니다. RDBMS는 구조화 된 데이터를 효율적으로 처리 할 수 ​​있습니다.