intrinsics

    4

    1답변

    log2를 __m128 변수에 적용하려고합니다. #include <immintrin.h> int main (void) { __m128 two_v = {2.0, 2.0, 2.0, 2.0}; __m128 log2_v = _mm_log2_ps(two_v); // log_2 := log(2) return 0; } 이이 오류를 반

    5

    1답변

    GDB에서 직접 데이터 유형 __m128 (Intel SSE 내장 함수에 사용됨) 변수의 값을 인쇄하는 방법이 있습니까? print $myVariable 명령은 int 및 float에 대해서는 정상적으로 작동하지만 __m128에 대해서는 정상적으로 작동하지 않습니다. 감사합니다.

    0

    1답변

    uint8_t * src를 uint16x8_t에로드하는 방법? 예를 들어 는, 우리는 다음을 수행 할 수 있습니다 uint8_t *src; ---> uint8x8_t mysrc = vld1_u8(src); 내가 uint16x8_t하는 mysrc를 변환하는 vreinterpret _ *() 또는 (uint16x8_t) mysrc을 사용할 수 없다는 것

    1

    1답변

    Renderscript 내장 함수는 매우 빠르고 유용합니다. 그러나 고유 한 내장 함수를 빌드하려는 상황이 있습니다. 현재의 회선은 matlab에서와 같이 "유효한"모드를 지원하지 않습니다. 그것을 갖는 것이 매우 좋을 것입니다. 그래서, 그렇게 할 수 있는지 궁금하네요 멋지게 자바 레이어 (기존 intrinsics)와 연결? 가능하다면, 어떻게 스케치하겠

    1

    1답변

    논의를 시작하기 위해, 기본 _mm_mul_epu32 차이와 _mm_mul_epi32 같습니다 _mm_mul_epu32는 부호없는 정수 (32 비트 -> 64 비트) SSE2 제공되며 취하여 생성 _mm_mul_epi32는 SSE4.1 제공되며, 소요 (32 비트 -> 64 비트) 정수를 체결 낸다 어떤 상황에서 사용해야하는지 이해할 수 없습니까? _mm_

    2

    1답변

    4 개의 정수로 채워진 128 비트 변수가 있습니다. [1,2,3,4]. 나는 교대하고 싶다. 그래서 나는 [2,3,4,0]을 얻을 수있다. 가장 빠른 방법은 무엇입니까? 내 현재 코드 : __m128 v1; v1 = (__m128)_mm_srli_si128( _mm_castps_si128(v1) , 4); 이 비트를 이동에 성공,하지만 속도와 캐시

    3

    2답변

    나는 SSE와 동일한 동작을 계산하기 위해 필요 : NEON으로 __m128i result1=_mm_avg_epu8 (upper, lower); 나는 다음을 수행하십시오 uint8x16_t result1=vhaddq_u8(upper, lower); 결과는 동일해야하지만, SSE와 명령 I을 얻었다 :가 91cb c895 aaa3 b0d4 cfc0 c

    5

    2답변

    iPad에서 수백만 개의 32 비트 정수에서 MSB (Most Significant Bit)를 매우 빠르게 계산해야합니다. 저에게는 평범한 C로 작성된 MSB의 저의 (못생긴) 구현이 있습니다. ARM 프로세서는 CLZ (count leading zeroes) 하드웨어 명령을 가지고 있습니다.이 명령은 매우 유용합니다. ARM reference에 따르면 내

    2

    1답변

    이것은 비트 조작에 대한 몇 가지 이전 질문에 대한 후속 조치입니다. int64_t b, t, c, m, r,z; b = x & -x; t = x + b; c = x^t; // was m = (c >> 2)/b per link z = __builtin_ctz(x); m = c >> 2+z; x = t|m; : I 세트 N 비트를 K (x는

    0

    3답변

    AIX 및 Linux에서 복잡한 응용 프로그램을 실행하려고하는 시나리오가 있습니다. 실행 중에 코드는 계산을 위해 내장 함수 sqrt()를 사용하지만 얻은 결과는 두 시스템에서 모두 다릅니다. 누구든지이 동작에 대한 이유를 알고 있습니까? 이것을 극복 할 수있는 방법이 있습니까? P.S 일부 값이 두 시스템에 동일하지만 그들 중 대부분은 다르다.