분산 컴퓨팅 기술을 배우는 데 관심이 있습니다. Java 개발자로서, 나는 아마도 Hadoop으로 기꺼이 시작할 것입니다. 먼저 책/자습서/기사를 추천 해주십시오.분산 컴퓨팅은 어디에서 시작해야합니까?
답변
MapReduce 및 분산 컴퓨팅과 관련된 몇 가지 논문을 먼저 읽으므로 더 잘 이해할 수있을 것입니다. 여기에 내가 운영자 추천하고 싶은 몇 가지 :
맵리 듀스 : 대형 클러스터에 대한 단순화 된 데이터 처리, http://www.usenix.org/events/osdi04/tech/full_papers/dean/dean_html/
Bigtable을 : 구조화 된 데이터의 분산 저장 시스템, http://www.usenix.org/events/osdi06/tech/chang/chang_html/
드라이어드 : 분산 순차적 빌딩 블록의 데이터 병렬 프로그램, http://pdos.csail.mit.edu/6.824-2007/papers/isard-dryad.pdf
병렬 계산 NG 조사 : 당신은 하둡을 더 잘 알고 싶다면 버클리에서보기, 한편 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.67.8705&rep=rep1&type=pdf
는, 어쩌면 당신은 하둡 맵리 듀스 워크의 소스 코드를 읽기 시작할 수 있습니다.
이 bookwise 내가 체크 아웃 것 - Hadoop A Definitive Guide합니다. Tom White가 Hadoop에서 지금까지 잘 해왔고, Cloudera에서 Doug Cutting (Hadoop 제작자)과 함께 작업했습니다.
UMD의 지미 린 (Jimmy Lin)도 Data-Intensive Text Processing with MapReduce이라는 책을 썼습니다. 다음은 최종 프리 프로덕션 버전에 대한 링크입니다 (저자가 작성한 website 링크).
모든 것 하둡 팟 캐스트 http://allthingshadoop.com/podcast에는 좋은 콘텐츠와 좋은 손님이 있습니다. 많은 것은 분산 컴퓨팅을 시작하는 데 중점을 둡니다.
MIT 6.824이 가장 좋습니다. Hadoop과 관련된 Google 논문 읽기만으로는 충분하지 않습니다. 더 깊이 가고 싶다면 체계적인 코스 학습이 필요합니다.
하둡보다 덜 복잡한 분산 컴퓨팅 플랫폼을 배우려면 Zillabyte를 사용해보십시오. 플랫폼에서 앱을 빌드하기 위해 Ruby 또는 Python을 알아야합니다.
LoLo가 말한 것처럼 Hadoop은 강력한 솔루션이지만 처음에는 거칠 수 있습니다.
분산 컴퓨팅에 대해 알아 보려면 자료는 http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/을 참조하십시오. 코스에서 추천하는 여러 가지 리소스가 있습니다.