neon

    2

    1답변

    : 나는이 포인터를 가지고 : int8x16_t* p1=(int8x16_t*)srcimg.data; int8x16_t* p2=(int8x16_t*)(srcimg.data+srcimg.cols); 문제는로드 기능이 하나라는 것이다 : int8x16_t vld1q_s8(__transfersize(16) int8_t const * ptr); 함수가 in

    3

    2답변

    나는 SSE와 동일한 동작을 계산하기 위해 필요 : NEON으로 __m128i result1=_mm_avg_epu8 (upper, lower); 나는 다음을 수행하십시오 uint8x16_t result1=vhaddq_u8(upper, lower); 결과는 동일해야하지만, SSE와 명령 I을 얻었다 :가 91cb c895 aaa3 b0d4 cfc0 c

    0

    2답변

    아래 코드는 8 비트 팔레 타이 징 형식에서 32-RGBA 행을 변환합니다. 구현하기 전에 아래 코드가 Direct-Math 또는 ARM Neon intrinsics 또는 인라인 어셈블리로 최적화하는 데 적합한 지 알고 싶습니다. 문서를 처음 보았을 때 테이블 룩업 부분을 덮을만한 내용은 없었습니다. void CopyPixels(BYTE *pDst, BYT

    0

    2답변

    NEON을 사용하는 ARM 프로세서 용 코드 최적화 작업을하고 있습니다. 그러나 문제가 있습니다 : 내 알고리즘에 다음 부동 소수점 계산이 포함되어 있습니다. round(x*b - y*a) 여기서 결과는 양수와 음수 일 수 있습니다. 사실 저는 2 개의 VMUL과 1 개의 VSUB를 사용하여 병렬 계산을합니다 (Q 레지스터와 32 비트 부동 소수점을 사

    1

    1답변

    Android JNI에서 Neon을 사용하여 알고리즘을 구현했습니다. 벡터를 함께 추가하고 싶을 때 두 가지 유형의 메소드가 있으며 그 차이를 발견 할 수 없다는 것을 알았습니다. // pairwise addition int8x8_t vpadd_s8(int8x8_t a, int8x8_t b); // VPADD.I8 d0,d0,d0 // addition

    -1

    1답변

    내 코드 참조 중 일부는 arm_neon.h를 사용하는 라이브러리입니다. "시뮬레이터"를 사용하여 컴파일하려고 할 때 많은 오류가 발생했습니다. 저는 LLVM 4.2 컴파일러를 사용하고 있습니다. 팔 네온으로 컴파일하려면 어떻게해야합니까?

    4

    1답변

    네온 지침 SIMD 및 암 어셈블리를 사용하여 4 포인트의 크기와 각도를 계산하고 싶습니다. 대부분의 언어에는 C++이 내장되어 있지만 각도 (atan2)는 계산하지만 부동 소수점 변수 (x 및 y)는 한 쌍만 계산합니다. 나는 4 값의 벡터에 대해 atan2를 계산하기 위해 q 레지스터를 다루는 SIMD 명령어를 이용하려고합니다. 정확도가 높지 않아야 할

    1

    1답변

    ARM 네온에 조건부 스토어를 생성하는 방법을 알아 내려고하고 있습니다. 내가하고자하는 것은이 SSE 교육과 동등합니다 : 무효 _mm_maskmoveu_si128 (__m128i d, __m128i n, char * p); 조건부로 d의 바이트 요소를 주소 p에 저장합니다. 선택기 n의 각 바이트의 상위 비트는 d의 해당 바이트가 저장 될지 여부를 결정합

    2

    1답변

    문제점은 arm7 아키텍처에서 지원되는 일부 네온 지침과 관련되어 있습니다. 기본 컴파일러 (Apple LLVM 5.0)를 사용하고 있지만 half-float 명령이 싫어서 다른 네온 명령도 인식합니다. 컴파일러 플래그가 있습니까 반 유동 : vcvt.f32.f16, q0, d1 사과 컴파일러는이 명령을 같은 오류를 제공하지 않지만이 gcc가 컴파일했습

    8

    1답변

    Android NDK에서 NEON 내장 함수 및 인라인 어셈블리를 사용하는 데 문제가 있습니다. : C. 예를 들어 로 컴파일하는 경우 GCC 4.6 및 4.8 C++ 코드를 컴파일 할 때 float32x4_t 같은 NEON 유형은 "잘못된 인수"오류를 제공하지만, 코드가 잘 컴파일, 여기에 몇 가지 코드입니다 함수 자체에서 : Invalid argumen