simd

    13

    2답변

    일부 코드를 작성하고 SIMD 내장 함수 SSE2/3을 사용하여 속도를 높이려고합니다. 내 코드는 일부 데이터를 XMM 레지스터에로드하고 여러 번 실행해야하는 자연의 코드입니다. 생성 된 어셈블러 코드를 보면 XMM0과 XMM1에서 다른 것을 다시로드하기 위해 GCC가 데이터를 메모리로 플러시하는 것으로 보입니다. 저는 x86-64 용으로 컴파일 중이므로

    20

    5답변

    누구나 c/C++ API를 제공하는 휴대용 SIMD 라이브러리를 권장하며, Intel 및 AMD 확장 프로그램과 Visual Studio에서 작동하며 GCC 호환 가능합니다. 나는 512x512 배수의 배열을 스케일링하는 것과 같은 것을 가속화하려고한다. 벡터 도트 곱, 행렬 곱셈 등 지금까지 단 하나만 발견했습니다 : http://simdx86.sourc