제 질문은 스트래글러 문제와 관련되어 있습니다. 정렬 (sort)에서는 알고리즘이며 알고리즘의 복잡성을 알 수 있으며 일정한 데이터 집합에서 실행될 때 실행 시간을 계산할 수 있습니다.Hadoop에서 작업 실행 시간을 계산할 수없는 이유는 무엇입니까?
왜 우리는 Hadoop에서 작업 실행 시간을 얻을 수 없습니까?
작업 실행 시간 또는 작업 실행 시간을 얻을 수 있다면 어떤 작업이 스트래글러인지 알 필요없이 신속하게 작업을 알 수 있습니다.
고맙습니다. 이제는 클러스터 용량 및 네트워크 대역폭과 같은 많은 요소에 의존하고 실행 중에 변경 될 수 있기 때문에 정확하게 시간을 계산할 수없는 이유를 알고 있습니다. – Flowra