0
aarch64의 새로운 ld4r 명령에 혼란 스럽습니다.Neon 64bit aarch64 : ld4r에 대한 혼동
다음 코드 (V [20-23]으로 같은 4 개의 32 비트 값을로드는)
ld1 { v20.4s }, [out1]
mov v21.16b, v20.16b
mov v22.16b, v20.16b
mov v23.16b, v20.16b
하지만 케이 :
ld1 { v20.4s }, [out1]
ld1 { v21.4s }, [out1]
ld1 { v22.4s }, [out1]
ld1 { v23.4s }, [out1]
다음 코드와 일치 할 것
ld4r { v20.4s, v21.4s, v22.4s, v23.4s }, [out1]
ld4r 명령을 잘못 읽었습니까? 4 차선 이상으로 복제하지 않아도 될까요?