NUMA 시스템에 로컬 캐시가 없으므로 소프트웨어 캐시 구현으로 원격 메모리에 액세스해야하는 작업의 성능이 향상됩니까?소프트웨어 캐시가 NUMA 시스템의 성능을 향상시켜야합니까?
1
A
답변
1
일부 NUMA 컴퓨터에는 로컬 캐시가 있습니다. 다중 소켓 Opteron 또는 Xeon 시스템을 사용하는 경우 각 소켓은 여러 수준의 캐시가있는 NUMA 도메인이며 일부는 코어와 일부 코어가 공유합니다. 적어도 Nehalem 이후 Intel 칩의 경우 모든 캐시에 원격 메모리 참조를 저장할 수 있습니다. 이것은 2-8 소켓의 성능에 좋지만, NumaConnect 또는 SGI NUMALink과 같은 장거리 캐시 일관성있는 상호 연결을 기반으로 구축 된 대형 시스템에서도 계속해서 이점이 있습니다.
그렇다면 비 일관된 시스템에 머물러 있다면 예/아니오 대답이 가능하기 전에 여러 매개 변수를 좁혀 야합니다. 소프트웨어 일관성 프로토콜에서 각 상태가 얼마나 비쌉니까? 걱정되는 앱의 흔적 때문에 전환이 얼마나 자주 발생합니까? 전환이 충분히 싸거나 선로가 충분히 오래 거주하고 있다면 확실히 도움이 될 수 있지만 구현, 기본 아키텍처 및 앱 자체의 동작에 따라 다릅니다.
다음은 관련 성능 문제가있는 실험 그룹입니다 (http://www.lfbs.rwth-aachen.de/content/17.html). 또한 Playstation 3에서 사용되는 Cell BE 아키텍처와 관련된 몇 가지 흥미로운 작업을 찾을 수 있습니다 (예 : http://researcher.ibm.com/files/us-alexe/paper-gonzalez-pact08.pdf).