simd

    1

    1답변

    float** matrix::mult(float** matrix1){ float** result=new float *[n]; int i,j,k; for(i=0;i<n;i++){ result[i]=new float [n]; } vect v1; vect v2; vect v3; ve

    3

    1답변

    이전에 SIMD 연산자를 사용하여 코드 효율성을 향상 시켰지만 해결할 수없는 새로운 오류가 발생했습니다. 이 작업에서는 속도가 가장 중요합니다. 데이터를 가져올 때까지 배열의 크기를 알 수 없으며 매우 작거나 (100 개 값) 또는 막대한 값 (1000 만 값) 일 수 있습니다. 후자의 경우 코드가 제대로 작동하지만 130036 개 미만의 배열 값을 사용하

    3

    3답변

    D에서 즉시 할 수 있습니까? 내가 도울 수 있다면 나는 LDC2 컴파일러를 사용하고있다. AVX 내장 함수 사용에 관심이 있습니다.

    1

    1답변

    XMM 레지스터를 사용하여 SSE2 명령어를 사용하여 어셈블리 언어로 다른 4 개의 숫자에 4 개의 숫자를 추가하려고합니다. 나는 성공했지만, 내가 이해하지 못했던 것을 찾아왔다. 나는 또한이 방법으로 할 경우 : movdqu xmm0, oword [var1] movdqu xmm1, oword [var2] paddd xmm0, xmm1 movdqu o

    0

    1답변

    MMX 및 SSE와 같은 SIMD 기능에 대해 C/C++ 내장 유형을 사용하는 방법에 대해 읽은 모든 내용은 이들을 불투명 한 형식으로 사용하고 내부 참조를 직접 참조하지 않아야 함을 나타냅니다. 그러나 많은 예제를 살펴보면 원시 데이터에 대한 포인터를 가져 와서 작업하기 전에 내장 유형에 대한 포인터로 재 해석합니다. 그러나 내장 유형에 대한 포인터를 사

    4

    1답변

    가정하자 나는 싶습니다 // ptr is a pointer to uint8_t array __m128i b = _mm_load_si128((const __m128i*) ptr); SSE2 를 사용하여 16 × 8 비트 부호없는 정수를로드하는 코드 줄을 가지고 b (각 16 비트)의 각 8 비트 부호없는 정수를 4 비트 상위 및 4 비트 하위 부분으로

    0

    1답변

    함수 내에서 sse simd 명령어를 사용하여 값을 계산하려고했습니다. double integrate (double from, double to,double* counter) { __m128d sum=_mm_setzero_pd(); __m128d val=_mm_setzero_pd(); __m128d width; __m

    9

    2답변

    SIMD와 벡터 프로세서의 차이점은 무엇입니까? 현재 나의 이해는 벡터 처리가 SIMD의 부분 집합이라는 것이다. 하지만 "SIMD는 벡터에만 국한되지 않는다"는 말을 들었습니다. 그 의미가 정확히 무엇인지 모르겠습니다. 구체적인 예가 있습니까? 또한 스칼라 아키텍처가 벡터 아키텍처보다 우수한 이유는 무엇입니까? 프로그램을 구현하고 프로그램하기가 쉽기 때문

    -3

    1답변

    방금 ​​asm 언어를 배우기 시작합니다. 몇 가지 질문이 있습니다. 1) C/C++에서 자주했던 것처럼 어셈블리 메모리를 통해 정렬 된 메모리 블록을 할당하는 방법은 무엇입니까? 2) 표준 C/C++ 수학 라이브러리/헤더 등에서 찾을 수있는 몇 가지 기본 수학 연산/함수를 다루는 asm 수학 라이브러리가 있습니까?

    0

    1답변

    NEON 기반 SIMD를 코드에 적용하는 중입니다. 그것은 밖으로 SIMDization 완벽하게 잘 작동하지만, 충돌을 일으키는 원인이되는 메이크 파일에 다음 한 줄, ifeq ($(TARGET_ARCH_ABI),armeabi-v7a) LOCAL_ARM_NEON := true endif 사람이 바로 코드가 절대적으로 같은 나머지와 NEON을