CUDA PTX 코드 % envreg <32> 특수 레지스터
CUDA 드라이버 API로 .cl 커널에서 생성 된 PTX 어셈블리 코드를 실행하려고했습니다. 1)로드 .cl 커널 2) JIT가 3) 컴파일 된 PTX 코드를 확인하고 저장 컴파일 : 내가했다 단계는 이러한 (표준 인 OpenCL 절차)이었다. 지금까지 그렇게 좋았습니다. ptx 어셈블리, % envreg3, % envreg6 등의 일부 특수 레지스터에
cuda
opencl
ptx
2012-12-10