위치와 다양한 속성이 정점 버퍼 개체에 저장되는 파티클 시스템이 있습니다. 값은 CUDA 커널에 의해 지속적으로 업데이트됩니다. 현재 GL_POINTS를 평면 원으로 사용하고 있습니다. 제가 관심을 갖는 것은이 입자를 3D 애니메이션 조류 모델과 같이 더 복잡하게 만드는 것입니다. 나는 최선의 접근 방법이 무엇인지 알아 내려고 노력 중이다. 대화를 위해서
많은 구조체 (클래스)와 독립 실행 형 함수가 있으므로 별도로 컴파일 한 다음 CUDA 커널에 연결하려고하지만 컴파일하는 동안 "외부 호출이 지원되지 않음"오류가 발생합니다 (링크하지 않음). nvcc는 항상 커널에서 인라인 함수를 사용하도록 강제합니다. 이것은 매우 초조하다! 누군가가 증분 컴파일을 달성 할 방법을 찾은 경우, 공유하십시오. 또한 NVID
CUDA 장치 코드에서 C++ 템플릿을 사용할 수 있습니다. 그래서지도를 사용하여 사전을 만들면 새로운 값을 삽입하는 작업이 원자적일 것인가? 특정 값의 출현 횟수를 계산하려는 경우, 즉 코드의 확률을 사용하여 코드 사전을 만듭니다. 내가 제대로 질문을 이해한다면 감사 맥
CUDA 커널의 명령어 및 상수 메모리 읽기 횟수를 줄이려고합니다. 결과적으로 상수 메모리에서 타일 크기를 가져 와서 매크로로 변환 할 수 있다는 것을 깨달았습니다. 전처리 중에 상수로 평가되는 매크로를 정의하여 각 값을 조정하고 각 커널에서 수행되는 명령어의 수를 줄이는 방법은 무엇입니까? 여기 은 예입니다 : #define TX 8
#define TY
으로 손으로 쓰는 CUDA 커널을 호출하면 추력을 사용하게되었습니다. 지금까지는 그렇게 좋았지 만, 데이터를 포함하는 thrust :: host_vector가있는 "필기"커널을 호출하고 싶을 때 어떻게해야할까요? 내 방식이되었다 (backcopy가 없습니다) : int CUDA_CountAndAdd_Kernel(thrust::host_vector<float
다음 코드 조각, 추력을 사용하여 CUDA와 코드 사전의 종류를 생성 (CUDA를위한 C++ 템플릿 라이브러리)을 감안할 때 : thrust::device_vector<float> dCodes(codes->begin(), codes->end());
thrust::device_vector<int> dCounts(counts->begin(), counts->
상수 메모리에 시뮬레이션 매개 변수를 설정하려고했지만 행운을 빌지 않았습니다 (CUDA.NET). cudaMemcpyToSymbol 함수는 cudaErrorInvalidSymbol을 반환합니다. cudaMemcpyToSymbol의 첫 번째 매개 변수는 string입니다 ... 심볼 이름입니까? 나는 그것이 어떻게 풀릴 수 있는지 이해하지 못한다. 어떤 도움
나는 CUDA로 놀고있다. 현재 문제가 있습니다. 특정 응답에 대해 큰 배열을 테스트 중이며 응답을 받으면 다른 배열에 데이터를 복사해야합니다. [V1] V2 : 가 [] [] [V1] [] [] [V2] 결과는 다음과 같이 표시한다 : 예를 들어 5 개, 소자 내 테스트 배열은 다음과 같다 ] 문제점은 결과를 저장할 두 번째 배열의 주소를 어떻게 계산합니