2010-05-12 3 views

답변

9

MapReduce 및 분산 컴퓨팅과 관련된 몇 가지 논문을 먼저 읽으므로 더 잘 이해할 수있을 것입니다. 여기에 내가 운영자 추천하고 싶은 몇 가지 :

는, 어쩌면 당신은 하둡 맵리 듀스 워크의 소스 코드를 읽기 시작할 수 있습니다.

3

이 bookwise 내가 체크 아웃 것 - Hadoop A Definitive Guide합니다. Tom White가 Hadoop에서 지금까지 잘 해왔고, Cloudera에서 Doug Cutting (Hadoop 제작자)과 함께 작업했습니다.

UMD의 지미 린 (Jimmy Lin)도 Data-Intensive Text Processing with MapReduce이라는 책을 썼습니다. 다음은 최종 프리 프로덕션 버전에 대한 링크입니다 (저자가 작성한 website 링크).

1

모든 것 하둡 팟 캐스트 http://allthingshadoop.com/podcast에는 좋은 콘텐츠와 좋은 손님이 있습니다. 많은 것은 분산 컴퓨팅을 시작하는 데 중점을 둡니다.

1

MIT 6.824이 가장 좋습니다. Hadoop과 관련된 Google 논문 읽기만으로는 충분하지 않습니다. 더 깊이 가고 싶다면 체계적인 코스 학습이 필요합니다.

2

하둡은 모든 분산 컴퓨팅 문제에 가장 적합한 도구는 아닙니다. 그것의 힘에도 불구하고, 그것은 또한 꽤 가파른 학습 곡선과 소유 비용을 가지고있다. 요구 사항을 명확히하고 HTCondor, JPPF 또는 GridGain과 같이 Java 세계에서 적합한 대안을 찾아 볼 수 있습니다 (언급하지 않은 것에 대해 사과드립니다).

1

하둡보다 덜 복잡한 분산 컴퓨팅 플랫폼을 배우려면 Zillabyte를 사용해보십시오. 플랫폼에서 앱을 빌드하기 위해 Ruby 또는 Python을 알아야합니다.

LoLo가 말한 것처럼 Hadoop은 강력한 솔루션이지만 처음에는 거칠 수 있습니다.

분산 컴퓨팅에 대해 알아 보려면 자료는 http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/을 참조하십시오. 코스에서 추천하는 여러 가지 리소스가 있습니다.