MapReduce 프로세스에서 "글로벌"또는 "친척"값을 계산하는 방법을 찾고 있습니다 - 평균, 합계, 최고 등. 직원의 급여와 연관된 ID가있는 직원 목록이 있다고 가정 해 봅시다. 다른 것들을 잔뜩). 처리 과정의 일부 단계에서 급여의 상위 10 %를받는 근로자가 누구인지 알고 싶습니다. 이를 위해서는 값을 "글로벌"관점으로 파악해야합니다.MapReduce - 상대 값 (평균, 최고 k 등)을 어떻게 계산합니까?
모든 값을 단일 감속기로 보낸다면 전역보기가 있지만 동시성이 느슨해지며 어색한 것처럼 보입니다. 더 좋은 방법이 있습니까?
(내가 사용하고 싶은 프레임 워크는 구글,하지만 난이 기술을 알아 내려고 노력하고있어 - 아니 프레임 워크 특정 트릭하시기 바랍니다)
감사합니다. Niels,하지만 아직 이해가 안됩니다.맵과 무효화의 무국적 특성 때문에 어떤 시점에서도 10 %의 정확한 한계를 알지 못합니다. 목록을 10 % 내가 원하는 값으로 정렬하더라도, 각 감속기는 전체 목록에서 해당 부분의 위치를 알지 못합니다. 단 하나의 감속기 만 사용하지 않으면 실제로 "전역" 전망. –
안녕하세요, 귀하의 질문 "톱 10"을 오해하여 답변을 업데이트했습니다! = "상위 10 %". 닐스 –