sse

    6

    1답변

    Intel의 Haswell CPU 마이크로 아키텍처를 사용한 병렬 프로그래밍에 대해 배우고 싶습니다. SIMD 사용 : asm/C/C++/(다른 langs)의 SSE4.2, AVX2? 책, 자습서, 인터넷 자원, 코스를 추천 할 수 있습니까? 감사합니다.

    3

    1답변

    저는 GDB를 하루 동안 사용 해왔다. 그러나 GDB와 인쇄 레지스터를 사용하여 마지막 세미콜론에 중단 점을 설정하면 XMM 레지스터에 저장된 데이터의 의미를 완전히 해석 할 수 없습니다. 데이터가 (MSB> LSB) 형식인지 또는 그 반대인지 알 수 없습니다. __m128i S = _mm_load_si128((__m128i*)Array16Bytes);

    3

    2답변

    --with-fpmath=387을 사용하는 소스에서 gcc 4.x를 컴파일하려고 시도했지만이 오류가 발생합니다 : "Invalid --with-fpmath=387". 나는 CONFIGS에보고하고 (문서가 여전히 가능한 옵션으로 언급에도 불구하고)이 옵션을 지원하지 않는 것을 발견 : 나는에 대한 실행 파일을 제공해야하기 때문에 기본적으로 case ${wit

    1

    1답변

    내가 가진 아주 잠시 동안 저를 도청 한 한 가지입니다 트리플위한 동료와 같은 루프 : for(int ii = 0; ii < ny; ii++){ for(int jj = 0; jj < nx; jj++){ ....some serious calculation.... for(int kk = 0; kk < CONSTANT; kk++){

    5

    1답변

    GDB에서 직접 데이터 유형 __m128 (Intel SSE 내장 함수에 사용됨) 변수의 값을 인쇄하는 방법이 있습니까? print $myVariable 명령은 int 및 float에 대해서는 정상적으로 작동하지만 __m128에 대해서는 정상적으로 작동하지 않습니다. 감사합니다.

    5

    3답변

    _mm_stream_ps 내장 함수를 가지고 놀고 있는데 성능을 이해하는 데 어려움이 있습니다. 정말 퍼즐 무엇 2.3 GHz Core i7 (I7-3615QM) (Laptop): 305.176 MB allocated Bandwidth (non-temporal): 24.2242 GB/s Bandwidth: 21.4136 GB/s

    1

    1답변

    인텔 코어 2 듀오에는 3 개의 SSE 유닛이있는 것으로 알려져 있습니다. 이들 3 개 개의 유닛은 3 개 SSE 명령어는 paralelly 실행할 수 있도록 1 예 : 또한 (빼기) 용, 다른 하나의 경우 : rA0 = mullps(rB0, rC0); \ rA1 = mullps(rB1, rC1); > All 3 take 1 cycle to be sche

    3

    1답변

    두 개의 SSE 128 비트 레지스터를 16 비트 값으로로드합니다. 값은 다음과 같은 순서에 있습니다 src[0] = [E_7, E_6, E_5, E_4, E_3, E_2, E_1, E_0] src[1] = [O_7, O_6, O_5, O_4, O_3, O_2, O_1, O_0] 당신은 SSE의 내장 함수를 사용하여이을 (할 수있는 좋은 방법이 있는지

    1

    2답변

    8 개의 부동 벡터 또는 4 개의 double을 수용하기 위해 AVX를 사용하는 SSE2 사인 및 코사인 함수 (CEPHES sinf 함수를 기반으로 한 Julien Pommier의 sse_mathfun.h에서)를 변환합니다. 그래서 줄리앙의 함수 sin_ps는 sin_ps8 (8 개의 부동 소수점 형)이되고 sin_pd4는 4 배가됩니다. (여기에서 "고

    1

    2답변

    나는 여러 번 실행 루프를 가지고 있고, 많은 시간을 비용 :이 코드를 최적화 한 for (int z=0; z<temp; z++) { float findex= a + b * A[z]; int iindex = findex ; outArray[z] += inArray[iindex] + (findex - iindex) * (inArr