2015-01-09 9 views
4

GFS와 일관성 모델에 대해 읽고 있었지만 일부는 이해하지 못했습니다. 이 발생할 수 Google 파일 시스템 일관성 모델

  • 동시 기록 APPEND 기록 중복 될 수 있습니다

    • 동시 기록 추가합니다 특히 , 누군가의 구체적인 예 시나리오 (또는 일어날 수없는 이유에 대한 설명)로 날을 제공 할 수 있습니다 정의되지 않은 지역에서 발생할 수 정의되지 않은 지역
    • (한 덩어리)에
    • 동시 쓰기는
  • 답변

    3

    나는에서 인용하고 있습니다. 기록 APPEND 어떤 복제에 실패 할 경우

    Table 1 from GFS whitepaper

    1. ", 클라이언트가 작업을 시도 : /이 추가 쓰기에 대한 가능한 결과를 요약 한 것입니다 표 1을 확인하세요. 결과적으로 동일한 청크의 복제본에는 전체적으로 또는 부분적으로 동일한 레코드의 중복을 포함하여 개의 다른 데이터가 포함될 수 있습니다. " 따라서 복제본에 오류가 발생하면 (예 : 시간 초과) 적어도 다른 복제본에서는 중복 레코드가 발생합니다. 동시 쓰기없이 발생할 수 있습니다.

    2. 중복 레코드를 발생시키는 동일한 상황으로 인해 일관성이없는 (따라서 정의되지 않은) 영역이 발생합니다. 복제본이 돌연변이를 확인하지 못하면 복제가 수행되지 않았을 수 있습니다. 이 경우 클라이언트가 추가를 다시 시도 할 때이 복제본은 누락 된 데이터 대신 패딩을 추가해야 레코드가 올바른 오프셋으로 기록 될 수 있습니다. 그래서 한 복제본에는 패딩이 있고 다른 복제본에는이 영역에 이전에 기록 된 기록이 있습니다.

    3. 쓰기에 실패하면 일관되지 않은 (따라서 정의되지 않은) 영역이 발생할 수도 있습니다. 더 흥미롭게도 성공적인 동시 쓰기는 일관성이 있지만 정의되지 않은 영역을 유발할 수 있습니다. "응용 프로그램의 쓰기가 크거나 청크 경계에 걸쳐 있으면 GFS 클라이언트 코드가 여러 번의 쓰기 작업으로 나누어집니다. [...]는 다른 클라이언트의 동시 작업으로 인터리브되고 덮어 쓰여질 수 있습니다.따라서 공유 파일 영역은 다른 클라이언트의 조각을 포함 할 수 있지만 모든 복제본의 작업이 동일한 순서로 성공적으로 완료되기 때문에 복제본은 동일합니다. 이것은 ". 일치하지만 정의되지 않은 상태 [...]에 답변

    +0

    Daniel이 답변을 주셔서 감사합니다. 대부분의 질문에 대답합니다. 여전히 한 가지가 있습니다. 클라이언트가 주 복제본과 만 통신한다는 사실 따라서 다른 복제본으로부터 수신 확인을 기다리는이 복제본입니다. 따라서 하나의 보조 복제본이 추가에 실패하면 기본 복제본에서이 문제가 발생했음을 알게되고 파일 끝까지 포인터를 늘릴 이유가 없으므로 새로운 appe nds는 그 불일치 영역을 나중에 무시해야합니다. 내가 뭘 놓치고 있니? – Simone

    +0

    나는 당신이 말하는 것처럼 할 수있을 것이라고 생각합니다. 하지만 GFS가 그렇게하지 않는다고 생각합니다. 나는 그들이 그것을 한 경우에 이것을 말할 것이라고 생각합니다. 내 무식한 추측은 동시 추가에 대한 처리량을 증가시키는 것입니다. 장애가 발생했을 때 주 포인터가 포인터를 되돌리려면 포인터가 진행되는 동안 다른 레코드 추가를 받아 들일 수 없습니다. 실패한 돌연변이에 대해서도 포인터를 증가 시키면 즉시 다른 추가를 받아 들일 수 있습니다. 누군가가이 이론을 확인/수정할 수 있다면 좋을 것입니다. –

    +0

    복제본에서 기본 복제본이 수신되면 그 복제본이 삽입하는 다음 레코드는 필히 동일해야합니다. 그것은 '클라이언트가 작업을 재 시도합니다'라고 말합니다. 그렇다면 당신이 말한 것처럼 다른 부가가 능성은 어떻게 될 것입니까? – sww

    1

    나는 정말 동시 APPEND과 관련이있다 생각하지 않는다 그러나 적어도 한 번 시스템의 의미론.

    오류는 대규모 분산 시스템의 근본적인 문제입니다. 오류가 발생하면 보낸 사람은 네트워크 반대쪽의 컴퓨터에서 해당 메시지를 완전히 수신했는지 여부를 알 수 없습니다. 이러한 경우를 위해

    분산 시스템은 메시지 중 하나 에서 가장 번을 전달하거나 적어도 한 번을 전달하거나 보장합니다.

    이 경우 GFS는 스토리지 노드에 적어도 번 배달을 번 이상 확인했습니다.

    +0

    감사 파일 영역을 남긴다! 그래서 기본 청크 서버에 오류가 발생하는 경우 이미 데이터를 작성 후이 경우에만 발생한다 파일의 끝 부분을 바로 업데이트 했습니까? – Simone