0
Map Reduce 프레임 워크를 사용하여 wordcount 프로그램을 작업 중이며 마침내 어떻게 작동하는지 구현할 필요가 있는지 이해합니다. 그러나 단일 입력을 다른 샤드로 나누는 방법과, 각 샤드에 스레드를 사용하여 맵 작업자를 할당하는 방법에 대해서는 혼란 스럽습니다. 난 당신이 리눅스 명령 분할을 사용하여 다른 파일을 만들 수 있습니다 알고,하지만 난 당신이하지 않는입력 파일을 MapReduce 용 샤드/파일로 나누는 방법