2014-09-28 4 views
0

간단한 질문이지만 주위를 둘러 보았지만 아무 것도 발견하지 못했습니다. CUDA 프로그래밍을 배우기 때문에 Kepler의 아키텍처에 대한 느낌을 얻고 싶었지만 나에게 의미가 없습니다. 워프가 32 스레드이고 4 개가 예약/실행되면 128 코어가 사용 중이며 64 개가 유휴 상태로 남아 있음을 의미합니다. 백서에는 독립 지침에 관한 내용이 담겨 있으므로 64 개 코어가 해당 지침을 위해 준비되어 있습니까? 그렇다면 누군가가 독립적 인 교육이 필요할 때를 보여 줄 수 있습니까? 미리 감사드립니다.GK110은 왜 192 개의 코어와 4 개의 워프를 가지고 있습니까?

답변

2

케플러의 각 SM에는 192 (SP) 코어와 4 개의 워프 스케줄러가 있습니다. 각 워프 스케쥴러는 이중 문제을 사용할 수 있습니다. 즉, 특정 상황에서 단일 발행 슬롯의 주어진 스레드 블록 (실제로 특정 워프)에서 2 개의 명령어를 실제로 실행할 수 있음을 의미합니다.

이 상황 중 하나는 명령어가 독립적이어야한다는 것이고, 이는 대략적으로 niether 명령어가 다른 명령어의 출력에 의존한다는 것을 의미합니다.

각각 4 개의 워프 스케줄러를 사용하여 이중 문제 가능성이 있으므로 이론적으로 최대 8 개의 워프 명령어 작업을 시작할 수 있습니다. 이는 이론적으로 192 (SP) 코어를 사용하기에 충분합니다.

SM은 일반적으로 "코어"라고하는 SP 단위 이외의 실행 단위를 가지므로 실제 명령어 조합은 주어진 실행 슬롯에서 어떤 실행 단위가 예약되는지를 결정합니다.

GK110 whitepaper에서 자세한 설명을 볼 수 있습니다.

+0

답장을 보내 주셔서 감사합니다.하지만 8 (SP) 날실이 시작되었으며 6이 함께 실행될 수 있고 다른 2 명이 다음주기를 기다려야한다고 말씀 드릴 수 있습니까? – Peezy

+0

예, 스케줄러는 단일 주기로 실행하기 위해 8 개의 SP 워프 명령어를 선택하지 않습니다. –

+0

도움을 주셔서 감사합니다. – Peezy