gpu-programming

    0

    1답변

    예를 들어, 나는 10x10 "cloth"mesh를 가지고 있다고 가정하고, 각 사각형은 두 개의 삼각형입니다. 이제 애니메이션을 만들고 싶다면 CPU에서 스프링 계산을 할 수 있습니다. 각 버텍스는 고유 한 "스프링"데이터를 가지며, 바라는 바에 따라 "천"의 유형과 같이 바운스됩니다. 그러나 최소 380 개가 필요합니까? 프레임 당 스프링 계산. 다행스

    6

    5답변

    , 나는 위키 백과와 인터넷 검색에 읽기 시도했지만, 난 여전히 몇 가지 질문이 : 나는 일부 GPU 예를 다운로드 CUDA에 대한 을 일부 .CU 있었다 파일 및 일부 CPP 파일을 포함하지만 모든 코드는 정상적인 C/C++ 코드 cudaMemcpyToSymbol과 같은 일부 별난 기능이며 나머지는 순수한 C 코드입니다. 질문은 .cu 코드가 nvcc로

    2

    1답변

    일부 이미지 처리 작업에는 GLSL을 사용하므로 전체 화면 쿼드를 그리고 프래그먼트 셰이더에서 처리하고 있습니다. 조각을 특정 우선 순위로 처리 할 수 ​​있을지 궁금합니다. 조각이 병렬로 처리되는 것을 알고 있으며 특정 조각에 대한 완료 시간을 보장 할 수 없으므로 어떻게 처리됩니까? 그냥 큰 대기열입니까? 그리고 그 패턴은 어떻게 생겼을까요? 스캔 라인

    1

    2답변

    GPU에서 프로그래밍 할 때 커널 기능을 디버깅하는 데 좋은 방법이 있습니까? 내가 사용하는 방식은 printf(...)을 사용하거나 결과를 CPU에 복사 한 다음 살펴 봅니다. 디버깅하는 데 너무 많은 시간이 소요됩니다. 감사합니다. 고맙습니다.

    8

    3답변

    GPU의 작동 방식을 더 잘 이해하려고 시도하고 있으며 Direct3D 또는 OpenGL과 같은 고급 API를 처리하는 방법에 대해 혼란스러워합니다. Direct3D 및 OpenGL 하드웨어 가속을 지원하는 그래픽 카드 광고를 보는 것은 매우 일반적입니다. 이것은 Direct3D 및 OpenGL 명령어를 하드웨어에서 직접 처리한다는 의미입니까? 나는 GPU

    0

    1답변

    GPT에서 SIMT 실행을 이해하는 데 약간의 문제가 있습니다. 지금까지 나는 스레드가 'warps'(예 : 32 threads/warp)에 배치되어 있습니다. 이 스레드는 동일한 유형이며 병렬로 실행될 수 있습니다 (단, &은 독립적으로 실행될 수 있습니다). 내가 읽고있는 책은 계속 나를 혼란스럽게합니다. 'It is then up to the inst

    1

    2답변

    GPU는 일반적으로 메모리 액세스 시간이 높다는 것을 알고 있습니다. 그러나 성능은 메모리 액세스를 기다리는 동안 다른 명령을 실행하여 액세스 시간이 '숨김'으로 크게 방해받지 않습니다. 64 개의 작업 항목과 16 개의 프로세서 코어가있는 파면이있는 경우 각 프로세서 코어에는 64/16 = 4 개의 작업 항목이 있습니다. 또한 모든 코어는 모든 작업 항목

    0

    1답변

    나는 커널 함수에 대한 블록 크기를 결정하기 위해 #define BLOCK_SIZE 32 과 같은 코드를 사용했다. 프로그램을 실행할 때 커널 기능에 적합한 블록 크기를 감지 할 수있는 방법이 있습니까?

    1

    2답변

    하나의 변수가 특정 값으로 설정 될 때까지 일부 블록을 차단하고 싶습니다. 그래서 간단한 do-while 루프가 작동하는지 테스트하기 위해이 코드를 작성합니다. __device__ int tag = 0; __global__ void kernel() { if (threadIdx.x == 0) { volatile int v; d

    13

    1답변

    로컬 메모리가 스레드 메모리 유형 인 레지스터 메모리보다 느리다는 것을 알게되었습니다. 공유 메모리는 빠르지 만 [스레드의] 로컬 메모리보다 빠릅니까? 내가 원하는 것은 중간 필터의 일종이지만 중앙값 대신 주어진 백분위 수를 사용합니다. 따라서 목록의 덩어리를 가져 와서 정렬 한 다음 적합한 목록을 선택해야합니다. 하지만 공유 메모리 목록을 정렬하거나 일이