gpgpu

    8

    2답변

    특정 스레드 구성에 대해 CUDA 커널을 호출 할 때 에 어떤 메모리 공간 (장치/호스트) 커널 매개 변수가 있어야하며 어떤 유형이어야하는지에 대한 엄격한 규칙이 있습니까? 가정하자 본인은 CUDA 커널에 직접 호스트 -integer 변수 정수 매개 변수 int foo, 을 통과 할 수 kernel<<<numblocks, threadsperblock >>>

    1

    1답변

    보이지 않는 X 창을 만들 수 있습니까? OpenGL ES 2.0 컨텍스트를 초기화하려면 수동으로 X 창을 만들어야하지만 보이지 않게하는 방법을 찾을 수 없습니다. GPGPU 만하고 있기 때문에 출력 창이 필요 없습니다. 사실, 그것은 내 경우에 다소 성가신 일입니다. 나는 earlier question에서 해결책을 알고 있습니다. 여기서는 InputOnl

    6

    1답변

    C++ AMP가 DirectX 11을 지원하는 GPU에 의해 가속된다는 것을 알고 있습니다. 그러나 컴파일 된 C++ AMP 프로그램이 DirectX 11 호환 GPU가없는 컴퓨터에서 실행되는 경우 어떻게됩니까? DirectCompute의 일부 소프트웨어 구현에서 에뮬레이트됩니까? CPU에서 실행됩니까 (SSE 스타일 지침 사용)? 아니면 그냥 실행에 실패

    1

    2답변

    AES 암호 해독을 수행하는 코드를 작성하려고합니다. 코드는 작동하지만 암호 해독 후 XOR 연산을 수행해야하는 Cipher Block Chaining을 추가 할 수 있기를 원합니다. 코드를 작성하고 이해하기 쉽게하기 위해 두 개의 커널을 사용하여 코드를 작성했습니다. 단일 블록에서 암호 해독을 수행하는 사람과 CBC 부분에 대해 XOR을 수행하는 사람.

    4

    1답변

    픽셀 버퍼 객체를 사용하여 GPU 메모리 내에서 직접 픽셀 데이터를 전송할 수 있어야한다는 사실을 읽었습니다. PBO가 OpenGL ES 2.0에서 지원되는지 이해할 수 없습니다. 나는 모순 된 정보를 발견했다. PBO는 OpenGL ES 2.0에서 지원됩니까? 그렇지 않은 경우 OpenGL ES 2.0에서 텍스처에 직접 데이터 (RGBA32)를 배치하는

    0

    1답변

    CUDA 및 스캔 작업을 사용하여 병렬로 트리를 작성할 수 있다는 NVIDIA 웹 사이트에서 읽었습니다. 스캔 작업을 사용하여 병렬로 힙을 만드는 방법을 설명하는 문서가 있는지 궁금합니다. 이것에 대한 코드가 포함 된 문서도 훌륭합니다. 나는 GPU 메모리에 몇 가지 값을 가지고 있는데, 그 중에는 최고 k 값을 반환해야한다. Parallel에서 힙을 빌드

    1

    1답변

    프로그래밍 가이드에서 인용 : 전역 메모리 액세스가 캐시됩니다. -dlcm 컴파일 플래그를 사용하면 컴파일시 L1 및 L2 (-Xptxas -dlcm = ca) (기본 설정) 또는 L2에만 캐시되도록 구성 할 수 있습니다 (-Xptxas -dlcm = cg) . 정확히 내가 VS 2008에서 l1 캐시를 사용하지 않도록 변경해야하는지 알고 싶습니다. 이 관

    2

    1답변

    우리는 GPGPU 코스에 대한 과제를 진행하고 있습니다. 우리는 알고리즘을 선택하여 CPU에서 구현했으며 이제 OpenCL로 변환합니다. 선택한 알고리즘은 모델을 삼각형 집합으로로드하고이를 복셀로 래스터 화합니다. 복셀은 점 데이터의 VBO로 정의됩니다. 그런 다음 기하학 쉐이더를 사용하여이 점들을 삼각형 모양의 보셀로 변환합니다. 따라서 OpenCL 프로

    5

    1답변

    나는 다음과 같은 일을 오전 에 대한 __shared__ 변수에 사용할 수 없습니다. 컴파일러는 질문의 제목에 명시된 것처럼 오류를 던지고 있습니다. 나는 이것이 왜 문제인지 이해하지 못한다.

    2

    1답변

    gpu의 맥락에서, 누군가 코어, 스레드 프로세서, 스트 렘프 프로세서, 멀티 프로세서 사이의 의미의 차이를 명확히 할 수 있습니까? 또한 GTX570 GPU (연산 기능 2.0)의 SM 당 활성 블록 수에 대한 제한을 아는 방법은 무엇입니까? 또한, 장치 속성은 GPU의 블록 당 최대 스레드가 1024이지만 cuda occupancy calculator는