neon

    0

    1답변

    이클립스 CDT에 대한 내 C 프로젝트에서 암 네온 내장 함수를 사용하고 있습니다. 그러나 arm_neon.h을 라이브러리로 포함 시켰을 때도 항상 "유형 XXX을 (를) 확인할 수 없습니다"오류가 표시됩니다. 예 : 유형 'uint8x8_t'을 (를) 확인할 수 없습니다. 유형 'uint8x16x4_t은'NDK 빌드를 사용하는 경우 이 프로젝트는 잘 구축

    0

    1답변

    비디오의 픽셀을 임의로 뒤섞는 NV12 비디오 변환을 적용하고 있습니다. 비디오의 시작 * //Temporary tables for the destination for (j = 0; j < height; j++) for (i = 0; i < width; i++) { toY[i][j] = j * width + i; toUV[i

    0

    1답변

    uint8_t * src를 uint16x8_t에로드하는 방법? 예를 들어 는, 우리는 다음을 수행 할 수 있습니다 uint8_t *src; ---> uint8x8_t mysrc = vld1_u8(src); 내가 uint16x8_t하는 mysrc를 변환하는 vreinterpret _ *() 또는 (uint16x8_t) mysrc을 사용할 수 없다는 것

    0

    1답변

    __m128, __m128i이 할당의 왼쪽에 있거나 매개 변수로 사용 된 몇 가지 고유 데이터 형식이 있습니다. SSE 코드를 NEON (iOS 배포 용)으로 변환하는 중이지만 이러한 (및 기타) SSE 데이터 유형에 대해 유사한 데이터 유형을 찾을 수 없습니다. . (관련 자료를 가리키는 참조 및 링크가 크게 감사합니다)

    5

    2답변

    iPad에서 수백만 개의 32 비트 정수에서 MSB (Most Significant Bit)를 매우 빠르게 계산해야합니다. 저에게는 평범한 C로 작성된 MSB의 저의 (못생긴) 구현이 있습니다. ARM 프로세서는 CLZ (count leading zeroes) 하드웨어 명령을 가지고 있습니다.이 명령은 매우 유용합니다. ARM reference에 따르면 내

    0

    1답변

    나는 네온을 지원하는 코어 텍스 A15 ARM 프로세서에 대한 상호 compil의 FFTW 3.3.3에 노력하고 에서 오프셋하지만 난이 오류를 얻을 : 을 /tmp/ccsNpqyK.s : 어셈블러 메시지 : /tmp/ccsNpqyK.s:1035 : 오류 : 내 구성 코 프로세서가 여기에 범위에서 오프셋 : ./configure를 - 접두어 =/usr/fft

    1

    1답변

    저는 어셈블리 전문가가 아니므로 간단 할 수 있습니다. 그래서 같은 매개 변수로 상수 값 예상 명령이있는 경우 : VQSHRN.U32 d0,q0,#16 가 어떻게 레지스터에 값으로 #16 대체 할 수있는, 예를 들어 r0을? 이 지시는 그렇게 할 수도 있지만, 그 능력에 관한 문서를 찾지 못했습니다. 이 일을하는 일반적인 방법이 있습니까? 이 경우에는

    2

    1답변

    현재 새로운 arm64 arch에 대한 lib를 컴파일하려고합니다. NEON 어셈블리가 여러 개 있는데 모두 오류가 발생합니다. asm에 알 수없는 레지스터 이름 "q0"이 있습니다. 나는이로 떨어지게 간단한 쓰기하더라도 : asm ( "" : : : "q0", "q1", "q2", "q3" ); 나는 arm6

    2

    1답변

    두 파트로 구성된 어셈블리 ARM NEON 코드에서 작업하고 있습니다. 첫 번째 부분은 일부 계산 된 값에 추가 된 기본 주소에서 시작하는 다양한 주소 (메모리)를 계산합니다 (결과는 매우 먼 메모리 주소입니다). 두 번째 부분은 첫 번째 부분에서 계산 된 주소에서 데이터를로드하고 사용해야합니다. 첫 번째와 두 번째 부분은 모두 병렬 처리가 가능하며 NEO

    5

    2답변

    나는 초당 수천 번 수행되는 특정 물리 계산과 관련된 iPhone 앱에서 작업하고 있습니다. 나는 프레임 속도를 향상시키기 위해 코드를 최적화하려고 노력 중이다. 제가 개선 할 부분 중 하나는 역 제곱근입니다. 지금은 Quake 3 fast inverse square root 방법을 사용하고 있습니다. 그러나 약간의 조사를 한 후에, 나는 there is