2012-01-07 11 views
2

Google 파일 시스템 (GFS) 문서를 읽었습니다. 이 신문은 GFS는, 나는 그것이 매우 중요해야한다는 걸릴 임의 쓰기 작업에 대한 "추가 작업"의 몇 가지 예가 무엇입니까?

optimized for appending operations rather than random writes. 

이 특성이 종이에 걸쳐 강조되는 것을 보는 것을 말한다.

실무 경험이 전혀없는 학생으로서 Google에서 말하는 Appending Operations의 실제 예는 무엇인가요? 그것은 꽤 강렬하게 들린다.

답변

1

Google 파일 시스템의 중심적인 제한 사항입니다. GPFS와 같은 범용 병렬 파일 시스템과는 대조됩니다. 그러나 예를 들어 올 때 훨씬 쉽게 디자인 할 수 있습니다. 복제. Google은 파일 시스템을 중심으로 응용 프로그램을 설계 할 수 있고 무작위 작업이 본질적으로 느리기 때문에 (회전하는 미디어에서)이 방법이 적합합니다. 사물의

톤이 작업을 "추가"됩니다

  • 새로운 로그 항목이 로그 파일에 추가됩니다. (GoogleFS는 이미 닫힌 파일에도 추가 할 수 있습니다 (특정 제한이 있습니다. 매우 비슷한 http://hadoop.apache.org/hdfs/은이를 수행 할 수 없습니다).
  • 새 웹 크롤링 데이터는 다음과 같은 경우에 기존 크롤링 버전을 덮어 쓰지 않고 추가됩니다. 파일. 모든 MapReduce
  • 출력 파일 (들)에 키/값 쌍을 추가, 처음부터 끝까지 파일을 작성하고 (당신은 또한 그 글을 읽어해야합니다).
  • 을 ...

seek 또는 pwrite 작업을 사용하여 파일의 중간에있는 데이터를 업데이트하지 않는 파일에 대한 모든 쓰기는 추가입니다. 임의 쓰기의 사용은 (고전적인) 데이터베이스 백엔드입니다.