gpgpu

8열

2답변

특정 스레드 구성에 대해 CUDA 커널을 호출 할 때 에 어떤 메모리 공간 (장치/호스트) 커널 매개 변수가 있어야하며 어떤 유형이어야하는지에 대한 엄격한 규칙이 있습니까? 가정하자 본인은 CUDA 커널에 직접 호스트 -integer 변수 정수 매개 변수 int foo, 을 통과 할 수 kernel<<<numblocks, threadsperblock >>>

1열

1답변

GPGPU를 위해 보이지 않는 X11 창을 만드는 방법은 무엇입니까?

보이지 않는 X 창을 만들 수 있습니까? OpenGL ES 2.0 컨텍스트를 초기화하려면 수동으로 X 창을 만들어야하지만 보이지 않게하는 방법을 찾을 수 없습니다. GPGPU 만하고 있기 때문에 출력 창이 필요 없습니다. 사실, 그것은 내 경우에 다소 성가신 일입니다. 나는 earlier question에서 해결책을 알고 있습니다. 여기서는 InputOnl

6열

1답변

C++ AMP는 호환되는 GPU가없는 컴퓨터에서 실행됩니까?

C++ AMP가 DirectX 11을 지원하는 GPU에 의해 가속된다는 것을 알고 있습니다. 그러나 컴파일 된 C++ AMP 프로그램이 DirectX 11 호환 GPU가없는 컴퓨터에서 실행되는 경우 어떻게됩니까? DirectCompute의 일부 소프트웨어 구현에서 에뮬레이트됩니까? CPU에서 실행됩니까 (SSE 스타일 지침 사용)? 아니면 그냥 실행에 실패

1열

2답변

OpenCL clEnqueueTasks 병렬 처리

AES 암호 해독을 수행하는 코드를 작성하려고합니다. 코드는 작동하지만 암호 해독 후 XOR 연산을 수행해야하는 Cipher Block Chaining을 추가 할 수 있기를 원합니다. 코드를 작성하고 이해하기 쉽게하기 위해 두 개의 커널을 사용하여 코드를 작성했습니다. 단일 블록에서 암호 해독을 수행하는 사람과 CBC 부분에 대해 XOR을 수행하는 사람.

4열

1답변

OpenGL ES 2.0에서 PBO를 사용하여 픽셀을 GPU 메모리로 직접 복사

픽셀 버퍼 객체를 사용하여 GPU 메모리 내에서 직접 픽셀 데이터를 전송할 수 있어야한다는 사실을 읽었습니다. PBO가 OpenGL ES 2.0에서 지원되는지 이해할 수 없습니다. 나는 모순 된 정보를 발견했다. PBO는 OpenGL ES 2.0에서 지원됩니까? 그렇지 않은 경우 OpenGL ES 2.0에서 텍스처에 직접 데이터 (RGBA32)를 배치하는

0열

1답변

병렬로 스캔을 사용하여 힙 빌드

CUDA 및 스캔 작업을 사용하여 병렬로 트리를 작성할 수 있다는 NVIDIA 웹 사이트에서 읽었습니다. 스캔 작업을 사용하여 병렬로 힙을 만드는 방법을 설명하는 문서가 있는지 궁금합니다. 이것에 대한 코드가 포함 된 문서도 훌륭합니다. 나는 GPU 메모리에 몇 가지 값을 가지고 있는데, 그 중에는 최고 k 값을 반환해야한다. Parallel에서 힙을 빌드

1열

1답변

vs 2008에서 컴파일 플래그를 지정하여 cuda에서 l1 캐시를 비활성화하는 방법

프로그래밍 가이드에서 인용 : 전역 메모리 액세스가 캐시됩니다. -dlcm 컴파일 플래그를 사용하면 컴파일시 L1 및 L2 (-Xptxas -dlcm = ca) (기본 설정) 또는 L2에만 캐시되도록 구성 할 수 있습니다 (-Xptxas -dlcm = cg) . 정확히 내가 VS 2008에서 l1 캐시를 사용하지 않도록 변경해야하는지 알고 싶습니다. 이 관

2열

1답변

OpenCL : 가변 길이의 배열 출력

우리는 GPGPU 코스에 대한 과제를 진행하고 있습니다. 우리는 알고리즘을 선택하여 CPU에서 구현했으며 이제 OpenCL로 변환합니다. 선택한 알고리즘은 모델을 삼각형 집합으로로드하고이를 복셀로 래스터 화합니다. 복셀은 점 데이터의 VBO로 정의됩니다. 그런 다음 기하학 쉐이더를 사용하여이 점들을 삼각형 모양의 보셀로 변환합니다. 따라서 OpenCL 프로

5열

1답변

초기화는 CUDA

나는 다음과 같은 일을 오전 에 대한 __shared__ 변수에 사용할 수 없습니다. 컴파일러는 질문의 제목에 명시된 것처럼 오류를 던지고 있습니다. 나는 이것이 왜 문제인지 이해하지 못한다.

2열

1답변

cuda gpu : 전문 용어의 정의

gpu의 맥락에서, 누군가 코어, 스레드 프로세서, 스트 렘프 프로세서, 멀티 프로세서 사이의 의미의 차이를 명확히 할 수 있습니까? 또한 GTX570 GPU (연산 기능 2.0)의 SM 당 활성 블록 수에 대한 제한을 아는 방법은 무엇입니까? 또한, 장치 속성은 GPU의 블록 당 최대 스레드가 1024이지만 cuda occupancy calculator는