2013-07-22 10 views
3

AVX2 수집 대기 시간에 대한 데이터가 있습니까?AVX2 수집 명령어의 대기 시간에 대한 데이터가 있습니까?

는 (예를 들어 하나의 캐시 라인을 액세스하는 _mm256_i32gather_ps 명령)

+1

하나이다 경험적 데이터 포인트 - 수집 된로드에 대한 빠른 벤치 마크를 최근에 실행했으며 처리량이 매우 나빴습니다. 분할 벡터를로드 했으므로 벡터의 첫 번째 절반은 하나의 캐시 라인에서 나온 것이고 두 번째 다른 반에서 절반 - 꽤 많은 사이클을 소요하는 것 같았다. –

답변

1

이 페이지는 모두 내장 대기 시간 데이터를 제공한다 :

Intel Intrinsics Guide

_mm256_i32gather_ps 대한 레이턴시가 단지 제

+0

NB : 최소 대기 시간입니다. – hdl