특정 스레드 구성에 대해 CUDA 커널을 호출 할 때 에 어떤 메모리 공간 (장치/호스트) 커널 매개 변수가 있어야하며 어떤 유형이어야하는지에 대한 엄격한 규칙이 있습니까? 가정하자CUDA 커널 매개 변수
본인은 CUDA 커널에 직접 호스트 -integer 변수 정수 매개 변수 int foo
, 을 통과 할 수
kernel<<<numblocks, threadsperblock >>> (/*parameters*/)
와 스레드의 1-D 그리드를 시작? 또는 내가 cudaMalloc
단일 정수에 대한 메모리라고 말하면 dev_foo
을 말한 다음 cudaMemcpy
foo
을 devfoo
에 입력하고 devfoo
을 커널 매개 변수로 전달해야합니까?