avx2

    0

    1답변

    Intel AVX2 명령어를 사용하여 프로그램을 작성하고 있습니다. 내 프로그램에서 최적화 수준 -O2 이상에서만 나타나는 버그를 발견했습니다 (-O1은 좋았습니다). 광범위한 디버깅 후에 버그가있는 영역을 좁 힙니다. 이제이 버그는 컴파일러가 __m256i 변수의 간단한 복사본 할당을 최적화하지 못하게하여 잘못된 것 같습니다. 다음 코드 단편을 고려하십시

    3

    1답변

    64 비트 아키텍처 용 인텔 어셈블리를 사용하여 내 비디오 디코더를 최적화하고 있습니다. 최적화를 위해 AVX2 명령어 세트를 사용하고 있습니다. 내 개발 환경 : - OS : - 윈도우 7 (64 비트) IDE : - MSVS 2008 (교수) CPU : - 코어 i5 (AVX까지 지원) 어셈블러 : - YASM 하드웨어를 업그레이드하지 않고 AVX2 코

    9

    2답변

    4x4 행렬을 만들고 각각을 변환하여 8x8 행렬을 전이시킬 수 있습니다. 이것은 내가 원하지 않는 일입니다. 또 다른 질문으로는 하나의 대답은 gave a solution이며 8x8 매트릭스의 경우 24 개의 명령어 만 필요합니다. 그러나 이것은 부유물에는 적용되지 않습니다. AVX2에는 256 비트의 레지스터가 포함되어 있으므로 각 레지스터는 8 개의

    16

    1답변

    저는 AVX2 명령어 세트의 새로운 수집 명령어 사용을 조사했습니다. 특히, 하나의 부동 소수점 배열이 대체되고 다른 부동 소수점 배열에 추가되는 간단한 문제를 벤치마킹하기로 결정했습니다. c에서이 값은 void vectortest(double * a,double * b,unsigned int * ind,unsigned int N) { int i

    -2

    1답변

    필자는 Intel의 SSE 명령어를 사용하여 성능을 향상 시켰으며 최근에는 AVX 명령어를 사용하려고했습니다. 문제점 : avx 명령어를 컴파일 할 수는 있지만 실행할 수 없습니다. 지침은 다음과 같습니다 : I는이 지침을 컴파일 할 수 있습니다 __m256i* avx1 = (__m256i*)vct1; __m256i* avx2 = (__m256i*)vct

    1

    1답변

    32 비트 모드에서 x86에서 실행되는 일부 코드 작업 중입니다. 이 모드에서는 8 개의 SIMD/AVX2-Registers (YMM0-7) 만 자유롭게 사용할 수 있다는 것을 알고 있습니다. 그러나 내 벡터 서브 루틴 중 일부는 때로는 그 양의 레지스터를 동시 적으로 사용합니다 (도로의 아래 어딘가에 여전히 필요합니다 - 나중에는 그리 멀지 않습니다).

    6

    1답변

    Intel의 Haswell CPU 마이크로 아키텍처를 사용한 병렬 프로그래밍에 대해 배우고 싶습니다. SIMD 사용 : asm/C/C++/(다른 langs)의 SSE4.2, AVX2? 책, 자습서, 인터넷 자원, 코스를 추천 할 수 있습니까? 감사합니다.

    3

    3답변

    AVX는 부동 소수점 데이터 유형 __m256 및 __m256d 및/또는와 같은 비트 논리 연산을 허용합니다. 그러나 C++에서는 float 및 double에 대한 비트 연산을 허용하지 않습니다. 맞다면 컴파일러가 IEEE754를 사용할 지 여부와 상관없이 플로트의 내부 표현에 대한 보장이 없으므로 프로그래머는 플로트 비트가 어떻게 보이는지에 대해 확신 할

    2

    1답변

    구성 : Intel (R) Core (TM) i7-4702MQ CPU (Haswell 아키텍처 포함), Windows 8, Intel C++ Compiller XE 13.0. 내가 AVX2 최적화 내 프로그램을 실행하려면 넣어 컴파일 플래그 : /QaxCORE-AVX2, /QxCORE-AVX2 하지만이 프로그램을 실행할 때 내가 얻을 오류 : Fatal E

    1

    1답변

    어셈블리 함수 호출 전에 모든 XMM 레지스터를 저장/밀어 넣어야합니까? 64 비트 개발의 릴리스 모드 (AVX2 사용)에서 내 코드의 크래시 문제를 관찰하고 있습니다. 디버그 모드에서 잘 작동합니다. 나는 XMM8 레지스터의 내용을 저장하고 함수 호출이 끝날 때 그것을 복원 한 다음 잘 동작했다. 어떤 아이디어 또는 참조?