2014-09-03 7 views
0

Tesla K20 모델에서 피크 단 정밀도 부동 소수점 성능은 약 3.52TFlops이지만 배정 밀도는 1.17TFlops이므로 비율은 3입니다. Tesla K20X는 3.95 및 1.31이고 Tesla K40은 4.29 및 1.43 TFlops입니다. 비율은 반복되는 것처럼 보입니다. 내 질문은 비율이 3과 2가 아닌 이유가 있다면, 그것은 나에게 논리적 인 것처럼 보이기 때문에 단 정밀도와 배정 밀도의 차이 때문입니다. 나는 GPUS와 GPGPUS에 대해 배우고있다. 그래서 그것에 대해 많이 모른다.NVIDIA Tesla의 단 정밀도와 배정 밀도 사이에 관계가 있습니까?

이 PDF의 두 번째 페이지에는 사양 테이블이 있습니다. NVIDIA-Tesla-Kepler-Family-Datasheet.pdf

답변

0

귀하가 나열한 모델은 모두 최대 단일 정밀도 비율의 1/3에 해당하는 최대 배정 밀도를 가진 Kepler 아키텍처를 기반으로합니다. 이것은 NVIDIA가이 하드웨어를 구축 한 방식입니다. 비교를 위해, Fermi는 이전의 하드웨어 생성으로 피크 더블과 단 정밀도 사이의 1/2의 비율을 가졌습니다.

당신은 명령 유형 및 하드웨어 세대, 명령 처리량 NVIDIA 설명서를 참조 할 수 있습니다

: 일반적으로 훨씬 낮은 두 대를 가지고 당신은 그 소비자 용 제품 (지포스 GTX)를 알 수

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#maximize-instruction-throughput

단 정밀도 - 하드웨어 버전에 따라 1/8, 1/12, 1/24 및 심지어 1/32입니다.