캐시 나는 그 알고리즘을 최적화 할 수 있지만 나는 또한 하드웨어 레벨에 최적화 원하는 물론 초 성능(읽기/쓰기) CPU는 L1, L2, L3
을 필요로하는 작업을 사용하는 방법.
최적화의 또 다른 종류는 CPU 캐시 (L1, L2, L3)을에 넣어 수
나는 물론 내 작업을 처리하는 스레드에 전체 코어를 할당하기 위해 CPU 선호도를 사용할 수 있습니다 가능한 한 멀리 "RAM 액세스"대기 시간을 피하기 위해 내 작업을 완료하는 데 필요한 데이터
이러한 개발에 어떤 API를 사용할 수 있습니까?
(즉, 내 질문 할 수있을 : "어떻게 캐시에 주어진 데이터 구조를 배치하는 CPU에 강제로?")
당신의 도움을