아마존 EMR에서 실행할 map-reduce 작업이 있습니다. 최대 400 개의 매퍼와 리듀서를 갖고 싶습니다. 중형 또는 대형 인스턴스를 사용하고 싶습니다. 필요한 인스턴스의 수를 어떻게 예측할 수 있습니까?Amazon EMR에서 인스턴스 수를 계산하는 방법은 무엇입니까?
게다가 한 작업이 2 분 이내에 끝나면 4 분 정도 걸리는 다른 작업을 실행하면 2 시간 동안 청구되거나 1 시간으로 간주됩니까?
아마존 EMR에서 실행할 map-reduce 작업이 있습니다. 최대 400 개의 매퍼와 리듀서를 갖고 싶습니다. 중형 또는 대형 인스턴스를 사용하고 싶습니다. 필요한 인스턴스의 수를 어떻게 예측할 수 있습니까?Amazon EMR에서 인스턴스 수를 계산하는 방법은 무엇입니까?
게다가 한 작업이 2 분 이내에 끝나면 4 분 정도 걸리는 다른 작업을 실행하면 2 시간 동안 청구되거나 1 시간으로 간주됩니까?
CLI 도구를 사용하여 작업 흐름을 작성하고 단계를 추가하면 동일한 작업 흐름에서 두 단계를 차례로 실행할 수 있으며 같은 시간 내에 계산됩니다.
GUI를 사용하면 작업 흐름을 다시 사용할 수 없으므로 각 작업마다 1 시간 씩 청구될 수 있습니다. 나는 이것을 시도하지 않았으므로 거기에 잘못이있을 수 있습니다.
확인 내가 정보를 가지고있는 곳입니다이 문서 :
https://cwiki.apache.org/confluence/display/MAHOUT/Mahout+on+Elastic+MapReduce
가 어떻게 매퍼/감속기의 수를 계산 않았다 당신은 정말 매퍼 = 400 = 감속기 어떤 이점을 얻을 것입니까 그것? 처리 요구에 따라 다릅니다. 그리고 나는 당신의 질문 중 두 번째 부분을 전혀 얻지 못했습니다. – Tariq