2017-12-28 37 views
0

: 맵리 듀스에서맵리 듀스와 HDFS 블록 내가 읽어 하둡 자바에 대한 교과서에서 크기

지도 작업을 일반적으로 한 번에 하나 개의 블록에 동작의 노드에 비해 그래서 당신이있는 경우에 너무 적은 작업 (이하 클러스터), 귀하의 작업이 달리 수행 할 수있는 것보다 느리게 실행됩니다

이 문장은 HDFS 블록 크기에 대한 단락에 있지만 그 의미를 이해하지 못합니다. 도와 주시겠습니까?

답변

0

매퍼 수는 입력 spilit 수에 따라 다르며 입력 spilit 수는 기본적으로 mapreduce의 블록 크기 수입니다. 따라서이 경우 파일 크기가 128MB이고 기본적으로 하나의 매퍼가 컴퓨팅에 사용되지만 mapred-site.xml의 일부 속성을 변경하여 매퍼 수를 늘릴 수 있다고 가정합니다. 동일한 매 128MB 파일이 더 많은 매퍼에 의해 계산되고 실행은 이전 상황보다 빠를 것입니다.