x64 어셈블러에서 작성한 함수를 실행하는 C++ 프로그램을 작성하려고합니다. 조금 더 빠르게 (그리고 CPU 기능과 함께) 속도를 높이고 싶습니다. 따라서 벡터 작업을 사용하기로했습니다.AVX/SSE에서 여러 개의 사인을 얻을 수 있습니까?
문제는 사인을 정수로 곱해야하므로 사인을 먼저 계산해야합니다. SSE/AVX에서이 작업을 수행 할 수 있습니까? 나는 명령어 fsin
을 알고 있지만 FPU에있을뿐만 아니라 한 번에 1 개의 사인도 계산합니다. 그래서 나는 FPU에서 밀어 넣고, fsin
으로 호출하고, 그것을 FPU에서 메모리로 띄운 다음 AVX 레지스터에 넣어야합니다. 번거롭게 할 가치가없는 것 같습니다.
이 라이브러리를 살펴보십시오. http://gruntthepeon.free.fr/ssemath/ – samgak
전체 정밀도가 필요합니까? –