gpu-programming

    5

    1답변

    특히, 내 문제는 실행하려면 <curand_kernel.h>이 필요한 CUDA 코드가 있다는 것입니다. NVRTC에는 기본적으로 포함되지 않습니다. 아마도 프로그램 컨텍스트 (즉, nvrtcCreateProgram에 대한 호출)를 만들 때 파일 이름 (curand_kernel.h)과 curand_kernel.h의 소스 코드를 보내야할까요? 나는 그렇게 할

    4

    1답변

    죄송합니다. 이런 일이 생기면 어쩔 수없는 일입니다. 난 우분투 신뢰할 수있는 tahr에 대한 계산에 대한 내 GPU를 사용하여 설치 theano. 나는 AMD Radeon HD 7670M GPU를 가지고있다. Mapped name None to device opencl0:0: Turks Traceback (most recent call last):

    3

    1답변

    누구나 금속 커널에서 임의의 부동 소수점을 가진 버퍼의 평균값을 계산하는 적절한 방법을 알고 있습니까? 컴퓨팅 명령 엔코더 디스패치 일 : threadsPerGroup = MTLSizeMake(1, 1, inputTexture.arrayLength); numThreadGroups = MTLSizeMake(1, 1, inputTexture.arrayLeng

    0

    1답변

    배열 종속성이있는 OpenACC 코드를 작성하고 있습니다. 내부 루프의 각 반복은 배열의 동일한 위치를 업데이트 할 수 있습니다. OpenACC에서 #pragma omp parallel private(i) { long unsigned int digit_local[d+11]; for(i=0;i<d+11;i++)

    0

    1답변

    각 커널에 대해 warp_execution_efficiency를 얻을 수 있지만 프로그램의 warp_execution_efficiency를 어떻게 얻을 수 있습니까?

    2

    1답변

    그래서 OpenCL 프로그램을 GeForce GT 610에서 실행하고 있습니다. CUDA가 더 나은 대안이 될 것이라는 것을 알고 있으며 나중에 CUDA 버전의 코드를 작성할 수 있습니다. 그러나 OpenCL에서 작성 중임을 알고 있기 때문에 AMD 그래픽 카드에서 실행할 수 있습니다. 초기화하는 동안 실행할 장치를 선택합니다. 다음은이 단계에서 내 프로그

    0

    1답변

    예를 들어 스왑 기능 (매트릭스의 블럭 블럭)을 만든 Cuda C 코드를 작성하고 있지만 블럭 수에 문제가있을 때마다 작동하지 않습니다. 커널의 점심 때 스레드 수. 예를 들어 제가 threadsPerBlock.x=threadsPerBlock.y=64 및 numBlocks.x=numBlocks.y=2048/threadsPerBlock.x 다음 swap<<<

    0

    1답변

    프로그래밍 된 Linux에서 실행중인 C++ 프로그램에서 amp.h 라이브러리를 사용하고 싶습니다. 그래서 빈 .cpp 파일에 amp.h 라이브러리를 포함시키고 콘솔을 통해 g ++ 컴파일러로 컴파일하려고했습니다. 당신이 .cpp 파일과 명령을 찾을 수 아래 내가 컴파일하는 데 사용 : #include <amp.h> #include <amp_graphic

    0

    2답변

    열역학 계산을 위해 OpenCL 커널을 작성하고 정말 이상한 버그를 발견했습니다. 내 커널은 다음과 같습니다 __kernel void energy(... float3 dest, int nlocal, ...){ int i = get_global_id(0); float3 ev = {0.0f, 0.0f, 0.0f}; for(...){

    0

    1답변

    우리는 셰이더 언어로 이미지 처리를 수행하고 결과 이미지를 오프 스크린 렌더링 버퍼에 출력하기 위해 GPU을 사용하고 있습니다. glDrawArrays을 호출 할 때마다 GPU가 프레임을 업데이트한다고 가정합니다. 그러나 우리는 그릴 배열이 10 개 이상이므로 잠재적 인 성능 문제가있을 수 있다고 생각합니다. 따라서 glDrawArrays이 모두 완료된 후