Elastic Map Reduce (AWS)의 Hadoop에서지도 감속기를 사용하고 있지만이를 문자열로 정렬하므로 정수 정렬을 수행하려고합니다. 그것을하는 방법? 나는 정수로 키를 가져 가고 키에 정수 정렬을 수행하려고합니다.Elastic Map Reduce (AWS)의 Hadoop에서 강제 정수 정렬
1
A
답변
2
정수를 선행 0으로 선행 (또는 패딩)하여 Hadoop (또는 EMR)에 사전 정렬을 수행하도록 할 것을 권장합니다. Hadoop은 정수 기반 정렬을 지원하지 않습니다. 예를 들어
, 이러한 열쇠 경우 :
0001
0015
0168
1900
그래서 하둡이 올바르게 정렬 할 수 있다는 : 당신은 당신의 매퍼에서이 같은 출력을해야
1
15
168
1900
.
0
이 관련 질문의 답을 데이터를 수정하지 않고도 사용할 수 있습니다 : how to sort numerically in hadoop's shuffle/sort phase?