3
AVX2 수집 대기 시간에 대한 데이터가 있습니까?AVX2 수집 명령어의 대기 시간에 대한 데이터가 있습니까?
는 (예를 들어 하나의 캐시 라인을 액세스하는 _mm256_i32gather_ps 명령)
AVX2 수집 대기 시간에 대한 데이터가 있습니까?AVX2 수집 명령어의 대기 시간에 대한 데이터가 있습니까?
는 (예를 들어 하나의 캐시 라인을 액세스하는 _mm256_i32gather_ps 명령)
NB : 최소 대기 시간입니다. – hdl
하나이다 경험적 데이터 포인트 - 수집 된로드에 대한 빠른 벤치 마크를 최근에 실행했으며 처리량이 매우 나빴습니다. 분할 벡터를로드 했으므로 벡터의 첫 번째 절반은 하나의 캐시 라인에서 나온 것이고 두 번째 다른 반에서 절반 - 꽤 많은 사이클을 소요하는 것 같았다. –