CUDA 응용 프로그램을 작성하는 경우, 다음 중 하나를 수행 할 수 있습니다이 이미지에 그림과 같이 드라이버 수준에서 또는 런타임 수준에서 작업 (라이브러리는 고급 수학에 대한 CUFFT 및 CUBLAS 있습니다) :CUDA 드라이버 API
저급 API의 성능이 향상되지만 코드 복잡성이 증가한다는 단점이 있습니다. 구체적인 차이점은 무엇이며 높은 수준의 API로 수행 할 수없는 중요한 사항이 있습니까?
C#을 사용하여 interop에 CUDA.net을 사용하고 있으며 드라이버 API의 복사본으로 구축되었습니다. 이것은 C#에서 다소 복잡한 코드를 작성하는 것을 촉진하지만 C++ 코드는 런타임 API를 사용하면 더 간단합니다. 이 방법으로 이길 수있는 것이 있습니까? 내가 볼 수있는 한 가지 이점은 지능적인 오류 처리를 나머지 C# 코드와 통합하는 것이 더 쉽다는 것입니다.
하나의 장점은 C. –