가상 분산 아키텍처를 사용하는 단일 시스템 만 사용하여 Hadoop의 확장 성 성능을 평가/시뮬레이션 할 수있는 도구, 패키지 또는 방법이 있습니까? 이러한 시스템은 시뮬레이션에서 서로 간섭하지 않는 작업 (예 : 블록화 된 I/O)을 기반으로 정확한 추정을해야합니다.가상 분산 노드에서 Hadoop 확장 성 성능 예측?
내 생각에 이것이 작동하는 방법은 모든 맵을 실행/작업을 순차적으로 줄이고 시스템이 얼마나 잘 조정되는지 추정하기 위해 일부 메트릭을 사용하는 것입니다 (예 : 가장 긴 실행지도 작업을 가져 와서 실행 시간은 병목 현상을 일으킬 것입니다.)
또한 출력을 구성하기 위해 함께 연결되는 여러 맵/축소 작업이 있습니다.
확장 성 및 단일 시스템. 오류를 찾으십시오. –
방금 제목을 읽었는지 확실하지 않거나 명확하지 않은 경우 명확히 말하면 실제로 더 빠르게 실행될 것이라고 기대하지는 않습니다 (어리석은 소리를냅니다!). 문제가 얼마나 잘 해결되었는지 실험 해보십시오. 시뮬레이션이나 추정을 통해 하위 문제로 – Gate