C++에서 실제 응용 프로그램을 작성하기 위해 CUDA 프로그램을 별도의 .cu 파일로 분리하려고합니다. 간단한 작은 프로그램이 있습니다 : 호스트와 장치에 메모리를 할당합니다. 호스트 배열을 일련의 숫자로 초기화합니다. 장치 배열 에 복사 호스트 어레이는 디바이스 커널에게 복사 다시 호스트 배열에 인쇄 장치 배열 결과 내가 모든 것을 넣을 경우가 좋은 작
맨손으로 GLUT 앱을 가지고 있습니다. 내가 Win32에서 위해를 컴파일 할 때 그것을 잘 작동하지만, 나는 64 그것을 컴파일하는 경우이 오류가 얻을 : 나는 "C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK\C\common\lib"에서 엔비디아 CUDA SDK를에서 오는 링커에 대한 입력으로 g
에 내 문제는 다음 내가 CUDA에 이항 분포를 사용하여 병렬로 난수를 많이 생성해야합니다. CUDA의 모든 난수 생성기는 Uniform Distribution을 기반으로합니다 (내가 아는 한). 이진 분포에 대한 모든 알고리즘은 Uniform 변형을 사용해야하므로 유용합니다. CUDA에서 이항 무작위 변형 생성을위한 라이브러리 또는 구현이 있습니까? 나는
하나의 컴퓨터 (GTX 275 포함)에서 GeForce 8400이 약 100 배 더 느리게 작동하는 CUDA 응용 프로그램이 있습니다. GPU가 아닌 CPU에서 코드가 실제로 실행되도록하는 일종의 대체 시스템이 있다는 것이 나의 의구심입니다. 실제로 코드가 GPU에서 실행되고 있는지 확인하는 방법이 있습니까? 이 대체물은 어딘가에 기록되어 있습니까? 어떤
CUDA 프로그래밍 (희망 사항 : C)과 관련하여 1 주일 만에 인터뷰를했습니다. 누군가 인터뷰 중에 예상 할 수있는 인터뷰 질문을 제안 할 수 있는지 궁금합니다. 나는 공식 프로그래밍 가이드를 통과했지만 지금은별로 편리하지 않습니다. 감사합니다. 난 당신이 준비해야한다고 생각
OpenCL에 대한 새로운 소식입니다. 내 코드의 첫 번째 반복에서는 큰 데이터 세트에 기본 메모리 버퍼를 사용하고 전역으로 선언했습니다. 그러나 이제는 타이밍을 개선하기 위해 찾고 있는데, 저는 이것을 위해 텍스처 메모리를 사용하고 싶었습니다. CUDA 버전에서는 cudaBindTexture와 tex1Dfetch를 사용하여 큰 1D 플로트 배열에 대한 데
나는 구성 프로세스 중에 몇 가지 일반적인 cuda 기능을 테스트하려고합니다. configure.ac에 어떻게 기록 할 수 있습니까? 예 : AC_TRY_COMPILE([],
[
__global__ static void test_cuda() {
const int tid = threadIdx.x;
const int bid = blockI
나는 GPU 프로그래밍에 관한 연구를하고 있으며 CUDA에 대해 더 알고 싶습니다. 난 이미 (위키 백과, 엔비디아와 다른 참조에서) 그것에 대해 많이 읽었습니다하지만, 난 여전히 몇 가지 질문이 있습니다 를 GPU의 멀티 프로세서를, 모든 멀티가 한가? 정확한 아키텍처의 설명이다 스트리밍 프로세서 및 모든 스트리밍 프로세서는 동시에 스레드 블록을 실행할
저는 CUDA로 프로그래밍하는 법을 배우기 시작하고 싶습니다. 언어뿐만 아니라 프로그램 디자인 - 내가 들었던 것에서와 같은 것들 - 조건없이 커널을 작성하여 모든 것을 스레드가 동일한 명령어를 실행하고 동기화 오버 헤드가 최소화됩니다. 필자가 들었을 때, 파이썬 래퍼는 C 라이브러리보다 사용하기 쉽고 코드가 훨씬 더 직관적입니다. 내가 이미 알고 있거나