GPU의 기본 커널에서 보조 커널을 실행하면 약간의 오버 헤드가 발생합니다. 이 오버 헤드의 양에 영향을 미치는 요인은 무엇입니까? 예 : 커널 코드의 크기, 커널이 시작되는 곳의 SM 점유율, 커널 인수의 크기 등.동적 병렬 처리 커널 시작의 오버 헤드에는 어떤 요소가 영향을 줍니까?
이 질문을 위해 다음을 포함하여 "오버 헤드"를 정의하십시오. 시간 간격 :
시작 일 : SM은 발사 명령을
끝을 본다 :는 SM이 하위 커널
플러스
시작의 명령을 실행 시작 : 마지막으로 SM은 하위의 명령을 실행 커널 (또는 아마도 하위 커널 명령어에 의한 마지막 쓰기는 관련 메모리 공간에 커밋 됨)
End : 하위 커널 시작 후 상위 명령의 다음 명령 실행.
언급 한 "오버 헤드"에는 시작 호출부터 자식 커널 시작까지의 기간 만 포함됩니까? – xhg
@aahung : 편집을 참조하십시오. – einpoklum