나는 꽤 오랫동안 찾고 있었고 인텔 제온 쿼드 코어가 완료 할 수있는 단 정밀도 부동 소수점 연산/클럭 사이클의 수를 공식적으로/결정적으로 나타내는 숫자를 찾을 수없는 것 같습니다. Intel Xeon 쿼드 코어 E5530 CPU를 가지고 있습니다. 내 CPU가 달성 할 수있는 최대 이론적 FLOP/s를 계산할 때이 값을 사용하고 싶습니다. MAX는 슬리퍼
하드웨어 프리 페칭은 페이지 경계를 넘지 않습니다. 나는 소프트웨어 프리 페치가 동일한 제한을 갖고 있는지, 즉 소프트웨어 프리 페치를 사용하여 미래의 TLB 미스를 피할 수 있는지 궁금합니다. 검색을 통해 가능할 것으로 보이지만 문서에서 명확한 내용을 찾을 수 없으므로 참조가 유용 할 것입니다. 저는 특히 네 할렘, 샌디 브릿지 및 웨스트 미어에 관심이
PAPI 고수준 API를 사용하여 간단한 프로그램에서 TLB 누락을 검사하지만 배열을 반복하면서 예상보다 큰 숫자가 표시됩니다. 다른 간단한 테스트 케이스에서는 결과가 상당히 합리적으로 보이기 때문에 결과가 실제이고 여분의 누락이 하드웨어 프리 페치 또는 유사 때문인 것으로 생각됩니다. 누구든지 번호를 설명하거나 PAPI를 사용함에있어 어떤 오류가 있음을