CUDA 소스 파일은 sm_XX이 sm_20, sm_30로 대체 될 수있는 명령 clang -Xclang -I$LIBCLC/include/generic -I$LIBCLC/include/ptx -Dcl_clang_storage_class_specifiers -O3 cudaFile.cu -S -o ptxOutputFile.ptx --cuda-gpu-arch=sm_XX
LLVM 컴파일러에서 지원하는 CUDA 컴파일을위한 최소 계산 기능은 무엇입니까?
과 LLVM 컴파일러를 사용하여 PTX 형식으로 컴파일 할 수 있습니다. 계산 기능 1.0의 경우 sm_XX가 sm_10으로 바뀌면 오류가 발생합니다. fatal error: cannot open file '/tmp/shared-25f2f5.s': No such file or directory 1 error generated.
따라서 LLVM의 최소 계산 기능은 2.0 인 것으로 보입니다. 이 가정이 맞습니까?
당신이 CUDA를 사용하는 경우 :'nvcc'은 컴퓨팅 기능> = 2.0 및 컴퓨팅 기능 1.x에서와 GPU를위한 Open64 파생 백엔드 목표를 위해 LLVM 파생 백엔드를 사용합니다 'sm_1x '에 대한 지원은 CUDA (및 NVIDIA 드라이버)에서 일부 제거되었습니다. – njuffa