2013-10-09 5 views
0

Intel Xeon Phi에는 코어 당 32 비트 폭의 벡터 레지스터 32 개가 있습니다. 각 벡터 레지스터는 사이클 당 16 개의 단일 정밀 부동 소수점 연산을 수행 할 수 있습니다. 그리고 1 사이클에서 2 가지 작업을 수행 할 수 있습니다 (v- 파이프에서는 1 번, u- 파이프에서는 1 번).Intel Xeon Phi의 클럭 사이클 당 곱셈의 수

벡터 레지스터에서 수행 된 벡터 곱셈과는 별도로 1 클럭 사이클에서 얼마나 많은 스칼라 곱셈을 수행 할 수 있는지 알고 싶습니다.

답변

1

몇 가지 오해가 있습니다. 코어 당 벡터 단위는 1 개입니다. 레지스터 값을 저장하고 계산하지 않습니다. 따라서 코어 당 사이클 당 1 512 바이트 폭 벡터 작업을 실행할 수 있습니다. 1 사이클에서 스칼라 곱셈을 할 수 있습니다. 동시에 둘 다를 발행 할 수는 없습니다. u & v 파이프를 사용하면 하나의 벡터 또는 스. 라 조작을 수행 한 다음 다른 파이프에서 메모리 조작을 실행할 수 있습니다. 싸이클마다 MADD (fused multiply-add) 명령을 수행하여 코어 당 사이클 당 2 번의 벡터 연산을 효과적으로 수행 할 수 있습니다.

+0

감사합니다. Xeon Phi에서 코어 당 2 회의 벡터 작업을 수행 할 수있는 링크를 공유해주십시오. 그리고 우리가 2 개의 벡터 연산을 말할 때, 둘 다 512' 비트의 넓은 벡터 연산이라는 것을 의미합니까? – arunmoezhi

+1

@sssylvester MADD가 아닌 FMA를 의미하지 않습니까? – damienfrancois