2016-05-31 9 views
0

CUDA 소스 파일은 sm_XX이 sm_20, sm_30로 대체 될 수있는 명령 clang -Xclang -I$LIBCLC/include/generic -I$LIBCLC/include/ptx -Dcl_clang_storage_class_specifiers -O3 cudaFile.cu -S -o ptxOutputFile.ptx --cuda-gpu-arch=sm_XXLLVM 컴파일러에서 지원하는 CUDA 컴파일을위한 최소 계산 기능은 무엇입니까?

과 LLVM 컴파일러를 사용하여 PTX 형식으로 컴파일 할 수 있습니다. 계산 기능 1.0의 경우 sm_XX가 sm_10으로 바뀌면 오류가 발생합니다. fatal error: cannot open file '/tmp/shared-25f2f5.s': No such file or directory 1 error generated.

따라서 LLVM의 최소 계산 기능은 2.0 인 것으로 보입니다. 이 가정이 맞습니까?

+0

당신이 CUDA를 사용하는 경우 :'nvcc'은 컴퓨팅 기능> = 2.0 및 컴퓨팅 기능 1.x에서와 GPU를위한 Open64 파생 백엔드 목표를 위해 LLVM 파생 백엔드를 사용합니다 'sm_1x '에 대한 지원은 CUDA (및 NVIDIA 드라이버)에서 일부 제거되었습니다. – njuffa

답변

1

정확해야합니다. CUDA 7.0 에서처럼 sm_1x에 대한 툴킷 및 드라이버 지원이 모두 중단되었습니다. sm_20이 작동하면 최소값이어야합니다.

CUDA 툴킷 및 테슬라 아키텍처 쿠다 툴킷 및 CUDA 드라이버에 대한 CUDA 드라이버 지원은 더 이상 sm_10, sm_11, sm_12 및 sm_13 아키텍처를 지원하지 않습니다. 결과적으로 CU_TARGET_COMPUTE_1x 열거 형 값이 CUDA 헤더에서 제거되었습니다.

http://developer.download.nvidia.com/compute/cuda/7_0/Prod/doc/CUDA_Toolkit_Release_Notes.pdf