cuda

3열

2답변

위치와 다양한 속성이 정점 버퍼 개체에 저장되는 파티클 시스템이 있습니다. 값은 CUDA 커널에 의해 지속적으로 업데이트됩니다. 현재 GL_POINTS를 평면 원으로 사용하고 있습니다. 제가 관심을 갖는 것은이 입자를 3D 애니메이션 조류 모델과 같이 더 복잡하게 만드는 것입니다. 나는 최선의 접근 방법이 무엇인지 알아 내려고 노력 중이다. 대화를 위해서

0열

3답변

더 나은 성능을 얻기 위해 cuda 프로그램을 최적화하는 방법은 무엇입니까?

생성 키에 대해 matlab 프로그램 (cuda)을 작성합니다. 더 나은 성능을 얻기 위해 cuda 프로그램을 최적화하는 방법은 무엇입니까?

1열

2답변

nvcc (CUDA)의 증분 컴파일

많은 구조체 (클래스)와 독립 실행 형 함수가 있으므로 별도로 컴파일 한 다음 CUDA 커널에 연결하려고하지만 컴파일하는 동안 "외부 호출이 지원되지 않음"오류가 발생합니다 (링크하지 않음). nvcc는 항상 커널에서 인라인 함수를 사용하도록 강제합니다. 이것은 매우 초조하다! 누군가가 증분 컴파일을 달성 할 방법을 찾은 경우, 공유하십시오. 또한 NVID

3열

2답변

지도가있는 CUDA <value, key> 및 원자 조작

CUDA 장치 코드에서 C++ 템플릿을 사용할 수 있습니다. 그래서지도를 사용하여 사전을 만들면 새로운 값을 삽입하는 작업이 원자적일 것인가? 특정 값의 출현 횟수를 계산하려는 경우, 즉 코드의 확률을 사용하여 코드 사전을 만듭니다. 내가 제대로 질문을 이해한다면 감사 맥

1열

1답변

매크로를 사용하여 CUDA 용 상수 정의

CUDA 커널의 명령어 및 상수 메모리 읽기 횟수를 줄이려고합니다. 결과적으로 상수 메모리에서 타일 크기를 가져 와서 매크로로 변환 할 수 있다는 것을 깨달았습니다. 전처리 중에 상수로 평가되는 매크로를 정의하여 각 값을 조정하고 각 커널에서 수행되는 명령어의 수를 줄이는 방법은 무엇입니까? 여기 은 예입니다 : #define TX 8 #define TY

13열

2답변

CUDA 소스 파일의 확장자는 .cu입니다. 헤더 파일은 무엇을 얻나요?

표준 규칙은 CUDA 소스 코드 파일을 .cu 확장자로 제공하여 C 파일과 확장자를 .c으로 구분합니다. CUDA 관련 헤더 파일에 해당하는 규칙은 무엇입니까? 하나 있습니까?

3열

1답변

CUDA로 숫자의 큰 배열을 정렬해야하므로 추력

으로 손으로 쓰는 CUDA 커널을 호출하면 추력을 사용하게되었습니다. 지금까지는 그렇게 좋았지 만, 데이터를 포함하는 thrust :: host_vector가있는 "필기"커널을 호출하고 싶을 때 어떻게해야할까요? 내 방식이되었다 (backcopy가 없습니다) : int CUDA_CountAndAdd_Kernel(thrust::host_vector<float

2열

1답변

최적화 CUDA

다음 코드 조각, 추력을 사용하여 CUDA와 코드 사전의 종류를 생성 (CUDA를위한 C++ 템플릿 라이브러리)을 감안할 때 : thrust::device_vector<float> dCodes(codes->begin(), codes->end()); thrust::device_vector<int> dCounts(counts->begin(), counts->

4열

3답변

상수 메모리 할당

상수 메모리에 시뮬레이션 매개 변수를 설정하려고했지만 행운을 빌지 않았습니다 (CUDA.NET). cudaMemcpyToSymbol 함수는 cudaErrorInvalidSymbol을 반환합니다. cudaMemcpyToSymbol의 첫 번째 매개 변수는 string입니다 ... 심볼 이름입니까? 나는 그것이 어떻게 풀릴 수 있는지 이해하지 못한다. 어떤 도움

0열

2답변

CUDA에서 다중 스레드로 장치 변수 사용

나는 CUDA로 놀고있다. 현재 문제가 있습니다. 특정 응답에 대해 큰 배열을 테스트 중이며 응답을 받으면 다른 배열에 데이터를 복사해야합니다. [V1] V2 : 가 [] [] [V1] [] [] [V2] 결과는 다음과 같이 표시한다 : 예를 들어 5 개, 소자 내 테스트 배열은 다음과 같다 ] 문제점은 결과를 저장할 두 번째 배열의 주소를 어떻게 계산합니