micro-architecture

5열

2답변

캐시 미스가 발생하면 CPU는 전체 캐시 라인을 주 메모리에서 캐시 계층으로 페치합니다. (일반적으로 x86_64에서 64 바이트) 이것은 최신 64 비트 시스템에서 8 바이트 너비의 데이터 버스를 통해 수행됩니다. (워드 크기가 8 바이트이기 때문에) EDIT : "데이터 버스"는이 문맥에서 CPU 다이와 DRAM 모듈 간의 버스를 의미합니다. 이 데이터

0열

1답변

긴 파이프 라인에서 늦은 lhr/ghr 업데이트

젊은 파이프 라인 명령어가 이미 브랜치 예측 메커니즘에 의해 처리되었지만 구현에 따라 해당 lhr (또는 ghr)이 여전히 긴 파이프 라인에서 실행 가능한 시나리오인지 궁금합니다. 파이프 라인 길이로 인해 이전 분기의 실제 결과로 업데이트되었습니다. 실용적인 시나리오인데 어떻게 작동합니까?

0열

1답변

실행 처리량을 최대화하기위한 최소한의 종속성 체인은 무엇입니까?

예를 들어 (a -> b -> c) -> (a -> b -> c) -> ...와 같이 주기적으로 반복되는 명령의 사슬이 주어지면 ... -> (a0-> b0-> (a0-> b0-> C0) : 이 아웃 오브 오더 실행의 혜택을 짧은 몇 가지 독립적 인 하위 종속 사슬로 분할 할 수 있다고 가정하면 C0) -> ... (A1-> B1-> C1) -> (A1->

0열

1답변

프로세서는 어떻게 가까운 수익에서 먼 수익을 식별 할 수 있습니까?

인텔의 커다란 매뉴얼을 읽으면서 원거리에서 돌아오고 싶다면 다른 코드 세그먼트에있는 프로 시저에 대한 호출 인 경우 반환 명령을 내리면됩니다 (스택 포인터를 이동시키는 즉각적인 인수가있을 수 있음) 포인터가 터진 후 n 바이트 씩 올라간다). 이것은 올바르게 해석하면 하드웨어가 세그먼트 선택기와 올바른 레지스터에 오프셋을 적용하기에 충분합니다. 그러나 시스