sse

    3

    1답변

    Intel SSE/AVX/FMA 내장 함수를 사용하여 일부 수학 함수에 대해 SSE/AVX 명령어를 완벽하게 인라이닝 할 수 있습니다. 다음 코드가 -march = - 64 -03 -mfma std_fma(float, float, float): # @std_fma(float, float, float) vfmadd213ss xmm0,

    2

    3답변

    의 큰 배열을 double 배열로 변환해야합니다. Visual C++ 15 업데이트 3에 SSE 컴파일러 내장 함수가 있습니까? EDIT : 두 개의 와이어 형식 간의 변환이므로 #define이 도움이되지 않습니다. 데이터 구조는 float로 저장되지만 타사 처리 라이브러리에는 double 배열이 필요합니다.

    -1

    1답변

    멀티미디어 확장과 병렬 처리 할 수있는 완벽한 프로그램을 프로그래밍하고 있습니다. 이 프로그램은 이미지를 변환하는 것으로 구성되어 있으므로 매트릭스로 가서 각 픽셀을 수정합니다. 이동 속도가 더 빠르면 멀티미디어 확장을 사용합니다. 처음에는 SSE3 확장을 사용하여 2.5 속도 향상을 얻었습니다. 다음으로 AVX 확장 (Double size vector)을

    0

    1답변

    SSE 명령을 배우려고하고 있는데 두 개의 matice를 곱하려고합니다. typedef union{ __m128 vec; float* afloat; }u_float; int main(){ __declspec(align(16)) u_float *mat1; mat1 = (u_float*)malloc(sizeof(u_float)*4

    1

    1답변

    저는 AVX2 x86 256 비트 SIMD 확장을 사용하고 있습니다. 32 비트 정수 구성 요소 현명 if-then-else 명령을 수행하려면 싶습니다. 인텔 문서에서 이러한 명령을 vblend라고합니다. 인텔 내장 가이드에는 _mm256_blendv_epi8 기능이 있습니다. 이 함수는 거의 필요한 것을 수행합니다. 유일한 문제는 8 비트 정수로 작동한다

    1

    1답변

    그래서 여기에 내가 달성하고자하는 것이있다. 내 컴퓨터에서 은 Microsoft Visual Studio 2015 또는 이상으로 컴파일해야하는데, 사용자의 CPU에서 사용할 수있는 최신 SIMD instrunction에 따라 일부 코드에 다른 버전이 있어야합니다. , SSE3 , SSSE3, SSE4.1, SSE4.2, AVX, AVX2 및 AVX512.

    1

    2답변

    처리 속도 향상을위한 병렬 처리 알고리즘을 살펴 봅니다. Agner Fog's vector class library, VCL을 테스트하고 싶습니다. Vec16c (SSE2 명령어 세트) 및 Vec32c (AVX 명령어 세트)과 같은 다른 벡터 클래스를 선택하는 방법이 궁금합니다. 인텔 ® 아톰 ™ x5-Z8350 프로세서를 사용하고 있으며 사양에 따라 SS

    10

    1답변

    누군가가 대기하고 Intel Intrinsic Guide에 주어진 처리량 값을 설명 할 수 있습니까? 대기 시간은 명령어가 실행되는 데 걸리는 시간의 양이고 처리량은 시간 단위당 시작할 수있는 명령어의 수임을 정확히 알고 있었습니까? 내 정의가 정확하다면 최신 CPU 버전 (예 : mulps)에서 일부 명령어의 대기 시간이 더 높은 이유는 무엇입니까?

    0

    1답변

    모든 LLVM IR 'fcmp'명령어는 호환 가능한 X86cmpps 명령어를 가지고 있습니까? 그리고 그 반대의 경우는 어떨까요? 모든 X86 cmpps 명령어 (레지스터 피연산자 만 사용)는 단일 LLVM 'fcmp'명령어로 설명 할 수 있습니까? 문제의 까다로운 부분은 NaN, Inf 's, -0.0 및 기타 각 사례가 각 언어로 처리되는 방법입니다.

    0

    1답변

    나는 문제가 여기에 C.에서 SSE와 행렬 - 행렬 곱셈을 수행하는 데 문제가 는 내가 지금까지 무엇을 가지고 있습니다 정확한 결과를 제공하십시오. 내가 놓친 게 있니? 그리고 dosent 검색은별로 도움이 보인다 - 모든 결과 중 단지 4 × 4 행렬을하고, 매트 VEC 또는 특별한 마법은 매우 이해하기 읽기 쉽고 단단하지 이잖아 ... 업데이트 : Wo