2013-05-01 1 views

답변

2

정수를 선행 0으로 선행 (또는 패딩)하여 Hadoop (또는 EMR)에 사전 정렬을 수행하도록 할 것을 권장합니다. Hadoop은 정수 기반 정렬을 지원하지 않습니다. 예를 들어

, 이러한 열쇠 경우 :

0001 
0015 
0168 
1900 

그래서 하둡이 올바르게 정렬 할 수 있다는 : 당신은 당신의 매퍼에서이 같은 출력을해야

1 
15 
168 
1900 

.