2017-02-25 15 views
0

aarch64의 새로운 ld4r 명령에 혼란 스럽습니다.Neon 64bit aarch64 : ld4r에 대한 혼동

다음 코드 (V [20-23]으로 같은 4 개의 32 비트 값을로드는)

ld1 { v20.4s }, [out1] 
mov v21.16b, v20.16b 
mov v22.16b, v20.16b 
mov v23.16b, v20.16b 

하지만 케이 :

ld1 { v20.4s }, [out1] 
ld1 { v21.4s }, [out1] 
ld1 { v22.4s }, [out1] 
ld1 { v23.4s }, [out1] 

다음 코드와 일치 할 것

ld4r { v20.4s, v21.4s, v22.4s, v23.4s }, [out1] 

ld4r 명령을 잘못 읽었습니까? 4 차선 이상으로 복제하지 않아도 될까요?

답변

0

ld4r은 단일 4- 요소 구조 만로드하고 SAME 레인을 통해 복제하는 것처럼 보입니다. 이것은 차선 - 대 - 차선 복제가 아닙니다.