드라이버 api를 사용하면 동일한 애플리케이션 ([1])에서 런타임 API의 사용을 배제합니다. 불행히도 cublas, cufft 등은 모두 런타임 API를 기반으로합니다. cuModuleLoad와 cublas 에서처럼 동적 커널 정의를 원할 경우, 옵션은 무엇입니까? 나는 이것을 염두에두고 있지만 어쩌면 더 많은 것들이 있습니다 :cuda 런타임 API 및 동적 커널 정의
가. 동일한 응용 프로그램에서 드라이버와 런타임 api의 평화 공존을 지원할 것이라는 소문이있는 컴퓨팅 기능 3.5를 기다리십시오.
B. 커널을 .so 파일로 컴파일하고 dlopen하십시오. 그들은 dlcose에서 언로드됩니까?
C. 드라이버 api에서 cuModuleLoad를 사용하려고 시도하지만 런타임 API의 나머지는 모두 시도합니다. 이것에 대한 희망이 있는지는 모르겠다.
jcuda 또는 pycuda가 거의 동일한 묶음에 있기 때문에 나는 이미 숨을 쉬고 있지 않습니다. 그들은 이미 알아 냈을 것입니다.
[1] CUDA Driver API vs. CUDA runtime
계산 기능 3.5 디바이스는 2013 년 1 월 이후에 기성품입니다. – JackOLantern
cm 3.5가 실제로이 문제를 해결하고 그 장치가 아직 널리 퍼져 있지 않음을 확인할 수 없었습니다. – melisgl
그리고 런타임 API - 드라이버 API 상호 운용성은 CUDA 3.0이 출시 된 시점 (약 4 년 전)에 해결되었습니다. 2009 년부터 * 모든 * CUDA 호환 하드웨어를 다루었습니다. – talonmies