CUDA가 어떤 종류의 코드를 생성하는지 보려면 객체 파일 외에도 ptx로 컴파일하는 것이 좋습니다. 내 루프 언 롤링의 일부는 꽤 시간이 걸릴 수 있기 때문에 내가 현재 해요하는 대신 모두 *.cu
→ *.ptx
및 *.cu
→ *.o
과 시간을 낭비 *.cu
→ *.ptx
→ *.o
를 컴파일 할 수 있도록하고 싶습니다 하기.PTX 출력을 사용하는 NVCC 별도 컴파일
-ptx
을 nvcc *.cu
줄에 단순히 추가하면 원하는 ptx 출력이 제공됩니다.
ptxas -c
을 사용하여 *.ptx
을 *.o
으로 컴파일하면 내 실행 파일에 오류가 발생합니다 (Relocations in generic ELF (EM: 190)
).
을 nvcc
으로 컴파일하면 은 자동으로으로 출력되지 않으므로 아무 것도 출력되지 않습니다.
내가 ptxas
에 전달해야하는 몇 가지 옵션이 있습니까? 별도의 컴파일로 ptx를 통해 어떻게 올바르게 컴파일해야합니까? 아니면, 그냥 nvcc
에게 ptx를 유지한다고 말할 수 있습니까?