simd

1열

1답변

float** matrix::mult(float** matrix1){ float** result=new float *[n]; int i,j,k; for(i=0;i<n;i++){ result[i]=new float [n]; } vect v1; vect v2; vect v3; ve

3열

1답변

어레이 오류 - 액세스 위반 위치 읽기 0xffffffff

이전에 SIMD 연산자를 사용하여 코드 효율성을 향상 시켰지만 해결할 수없는 새로운 오류가 발생했습니다. 이 작업에서는 속도가 가장 중요합니다. 데이터를 가져올 때까지 배열의 크기를 알 수 없으며 매우 작거나 (100 개 값) 또는 막대한 값 (1000 만 값) 일 수 있습니다. 후자의 경우 코드가 제대로 작동하지만 130036 개 미만의 배열 값을 사용하

3열

3답변

D에 명시적인 simd 코드

D에서 즉시 할 수 있습니까? 내가 도울 수 있다면 나는 LDC2 컴파일러를 사용하고있다. AVX 내장 함수 사용에 관심이 있습니다.

1열

1답변

xmm 정수 추가 - 세그먼트 화 오류

XMM 레지스터를 사용하여 SSE2 명령어를 사용하여 어셈블리 언어로 다른 4 개의 숫자에 4 개의 숫자를 추가하려고합니다. 나는 성공했지만, 내가 이해하지 못했던 것을 찾아왔다. 나는 또한이 방법으로 할 경우 : movdqu xmm0, oword [var1] movdqu xmm1, oword [var2] paddd xmm0, xmm1 movdqu o

0열

1답변

SIMD 내장 함수 및 포인터

MMX 및 SSE와 같은 SIMD 기능에 대해 C/C++ 내장 유형을 사용하는 방법에 대해 읽은 모든 내용은 이들을 불투명 한 형식으로 사용하고 내부 참조를 직접 참조하지 않아야 함을 나타냅니다. 그러나 많은 예제를 살펴보면 원시 데이터에 대한 포인터를 가져 와서 작업하기 전에 내장 유형에 대한 포인터로 재 해석합니다. 그러나 내장 유형에 대한 포인터를 사

4열

1답변

어떻게 16 × 8 비트 __m128i 값 32 × 4 비트 정수를 추출 할

가정하자 나는 싶습니다 // ptr is a pointer to uint8_t array __m128i b = _mm_load_si128((const __m128i*) ptr); SSE2 를 사용하여 16 × 8 비트 부호없는 정수를로드하는 코드 줄을 가지고 b (각 16 비트)의 각 8 비트 부호없는 정수를 4 비트 상위 및 4 비트 하위 부분으로

0열

1답변

SSE SIMD를 사용하여 함수 변환

함수 내에서 sse simd 명령어를 사용하여 값을 계산하려고했습니다. double integrate (double from, double to,double* counter) { __m128d sum=_mm_setzero_pd(); __m128d val=_mm_setzero_pd(); __m128d width; __m

9열

2답변

SIMD vs 벡터 아키텍처

SIMD와 벡터 프로세서의 차이점은 무엇입니까? 현재 나의 이해는 벡터 처리가 SIMD의 부분 집합이라는 것이다. 하지만 "SIMD는 벡터에만 국한되지 않는다"는 말을 들었습니다. 그 의미가 정확히 무엇인지 모르겠습니다. 구체적인 예가 있습니까? 또한 스칼라 아키텍처가 벡터 아키텍처보다 우수한 이유는 무엇입니까? 프로그램을 구현하고 프로그램하기가 쉽기 때문

-3열

1답변

x86 어셈블리 언어에 대한 몇 가지 질문이 있으십니까?

방금 asm 언어를 배우기 시작합니다. 몇 가지 질문이 있습니다. 1) C/C++에서 자주했던 것처럼 어셈블리 메모리를 통해 정렬 된 메모리 블록을 할당하는 방법은 무엇입니까? 2) 표준 C/C++ 수학 라이브러리/헤더 등에서 찾을 수있는 몇 가지 기본 수학 연산/함수를 다루는 asm 수학 라이브러리가 있습니까?

0열

1답변

NEON SIMDization을 사용할 때 Android가 다운되는 이유는 무엇입니까? 신호 11 (SIGSEGV), 코드 1 (SEGV_MAPERR)

NEON 기반 SIMD를 코드에 적용하는 중입니다. 그것은 밖으로 SIMDization 완벽하게 잘 작동하지만, 충돌을 일으키는 원인이되는 메이크 파일에 다음 한 줄, ifeq ($(TARGET_ARCH_ABI),armeabi-v7a) LOCAL_ARM_NEON := true endif 사람이 바로 코드가 절대적으로 같은 나머지와 NEON을