__CUDA_ARCH__
을 사용해 보았지만 어딘가에서이 코드는 장치 부분에서만 작동합니다. 그 후 github에서이 코드를 발견했습니다. link코드의 호스트 부분에서 GPU의 현재 계산 기능을 얻으려면 어떻게해야합니까?
더 좋은 방법이 있습니까? GPU의이 cudaMallocManaged가 & & cudaMemcpys 대신 일어날 장소 또는 cudaMallocs을 할 경우에 통합 된 메모리를 지원하는 경우 내가 (호스트 코드)를 확인하고자하기 때문에
나는 이것을 요구하고있다.
내가하고 싶은 것이의예 :
int main() {
// IF CUDA >= 6.0 && COMPUTE CAPABILITY >= 3.0
// USE cudaMallocManaged
// ELSE
// USE cudaMallocs && cudaMemcpys
// END IF
return 0;
}
나는 계산 기능을 얻기위한 SDK에 코드 예제가 있다고 생각합니다. –
@PaulR 그래서'__host__ cudaError_t cudaGetDeviceProperties (cudaDeviceProp * prop, int device)'를 사용하고'managedMemSupported' 변수에서 값을 읽어야한다고 제안합니다. 'cudaMallocManaged'의 정의조차 가지고 있지 않은 구형 CUDA API로 정확히 동일한 코드를 컴파일하고 싶다면 어떻게해야할까요? – xorz57
잘 모르겠다. CUDA로 작업 한 이후 오랜 시간이 걸렸습니다. SDK에 코드 기능이 있다고 말하는 코드 샘플이 있다는 것을 기억했습니다. 그게 전부입니다. –