intrinsics

    0

    1답변

    3D 공간의 점을 2D 이미지 좌표로 투영하려고합니다. 나는 교정 된 내장 함수와 내가 사용하고있는 카메라의 외인성을 가지고있다. 저는 카메라 행렬 K와 왜곡 계수 D를 가지고 있습니다. 그러나, 나는 투영 된 이미지 좌표를 왜곡되지 않은 이미지로 만들고 싶습니다. 제 연구에서이 작업을 수행하는 방법이 두 가지 발견되었습니다. 사용을 OpenCV의 getO

    0

    1답변

    Neon 내장 함수를 사용하여 두 이미지 (회색 음영)를 빼기 위해 연습 중이므로 C 내장을 사용하여 두 벡터를 빼는 가장 좋은 방법은 무엇인지 모르겠습니다. void subtractTwoImagesNeonOnePass(uint8_t *src, uint8_t*dest, uint8_t*result, int srcWidth) { for (int

    0

    1답변

    64 비트 정수의 n 번째 비트를 1로 설정해야합니다. (여기 http://msdn.microsoft.com/en-us/library/z56sc6y4(v=vs.90).aspx 문서화) 고유이있다 : 작업을 수행 unsigned char _bittestandset64( __int64 *a, __int64 b ); . 제 질문은 비트 (테스트없이)를 설

    1

    1답변

    NEON Intrinsics에서 작동하도록 코드를 수정하려고 했으므로 속도가 향상되었습니다. 불행히도 아무 것도 올바르게 작동하지 않는 것 같습니다. 아무도 무슨 일이 일어나고 있는지 전혀 모른다. double을 단일 부동 소수점 요소로 업데이트했습니다.는 typedef float REAL; typedef REAL VEC3[3]; type

    4

    2답변

    말 읽기되지 않은 휘발성 지역 바르를 제거 할 수 있습니다,이 코드가 있습니다. 그러나 휘도가으로 표시되어 컴파일러가 모두 제거 할 수 있습니까? Visual C++ 2010에서의 테스트 결과 모순 된 결과가 나타납니다. VC++에서 최적화 (속도 최대화)를 사용하면 위 함수에 c라는 로컬 변수가 포함됩니다 (생성 된 어셈블리 목록을보고). 그러나 대입 연

    3

    1답변

    나는이 기능을 보았고 나는 그것이 무엇을하는지 알고 싶었다. 그래서 나는 다음을 썼고, mingw32로 컴파일하고 Wine과 Windows에서 실행했다. 둘 다 프로그램이 충돌했다. #include <stdio.h> #include <stdlib.h> #include <intrin.h> int main() { unsigned char j = __i

    2

    3답변

    나는이 질문을 진술로 알려줄 것이다. 이 코드는 의도 한대로 작동하지만 속도가 매우 느립니다. newton 메서드를 더 빨리 수렴 할 수있는 방법 또는 __m256 var을 부동 소수점 배열 등을 사용하지 않고 단일 부동 소수점과 동일하게 설정하는 방법이 있습니까? __m256 nthRoot(__m256 a, int root){ #define align

    12

    2답변

    SIMD 지원을 구현하는 동안 인텔의 내장 함수 가이드를 읽었습니다. 나는 약간의 혼란을 가지고 있으며 나의 질문은 아래와 같다. __m128 _mm_cmpeq_ps (__m128 a, __m128 b) 설명서에는 압축 된 단 정밀도 부동 소수점을 비교하는 데 사용됩니다. "포장 된"의미는 무엇입니까? 플로트 값을 사용하기 전에 어떻게 든 포장해야합니까?

    6

    1답변

    저는 Visual C++ 2012를 사용하여 SSE 내장 함수를 시작하려고합니다. 일부 포인터가 필요합니다. 각 배열은 4 signed short입니다 (각 배열은 64 비트이므로 총 128 개입니다). XMM 레지스터의 상위 비트에 하나를로드하고 하위 비트에 다른 하나를로드하려고합니다. SSE 내장 함수를 사용하여 효율적으로이 작업을 수행 할 수 있습니까

    1

    1답변

    NEON 레지스터로로드 유형 uint32x4_t의 r1, r3 및 r4를 갖는 나는 다음과 같은 코드를 가지고 : 난 그냥 GCC 실제로 vmov 명령에 r4 = r1 변환 여부를 궁금 r3 = veorq_u32(r0,r3); r4 = r1; r1 = vandq_u32(r1,r3); r4 = veorq_u32(r4,r2); r1 = veorq_u3