gpu-programming

    4

    1답변

    일부 GPU 계산을 시도하는 Apple의 Metal을 배우고 있습니다. 나는 Apple이 제공 한 matrix multiplication example을 확인했습니다. 내가 이해할 수없는 점이있다. 파일 MetalMatrixMult.h // Number of rows in matrices A and C. @property (nonatomic) uint16

    -1

    1답변

    저는 CUDA 프로그래밍이 처음이었고 실행 시간의 차이를보기 위해 다른 간단한 커널을 테스트했습니다. 최적화 및 얻을 없애 내가 -g -G와 함께 컴파일 __global__ void mathKernel4(float *c) { int tid = blockIdx.x * blockDim.x + threadIdx.x; float ia, ib;

    1

    1답변

    나는 Professional CUDA C Programming을 읽고있다, 그리고 GPU 아키텍처 개요 섹션 :는 CUDA 관리하고 32라는 워프 그룹에서 스레드를 실행하는 단일 명령 다중 스레드 (SIMT) 아키텍처를 사용합니다. 워프의 모든 스레드는 동일한 명령을 동시에 실행합니다. 각 쓰레드는 자체 명령어 주소 카운터와 레지스터 상태를 가지며 현재 명

    0

    1답변

    GPU의 토크 할당에 이상한 문제가 있습니다. 두 개의 NVIDIA GTX Titan X GPU가있는 단일 시스템에서 Torque 6.1.0을 실행 중입니다. 나는 스케줄링을 위해 pbs_sched를 사용하고있다. 다음과 같이 휴식 NVIDIA-SMI 출력은 다음과 같습니다 #PBS -S /bin/bash #PBS -l nodes=1:ppn=1:gpus=

    0

    1답변

    저는 방금 CUDA의 __byte_perm 내장 함수와 동일한 AMD를 발견했습니다. amdgcn_ds_swizzle (또는 적어도 바이트 순열 함수와 같다고 생각합니다.) 내 문제는 이것입니다 : CUDA의 바이트 퍼밋은 2 개의 부호없는 32 비트 정수를 취한 다음 선택기 인수 (16 진수 값으로 제공됨)의 값에 따라이를 치환합니다. 그러나 AMD의 s

    1

    1답변

    나는 이미지 처리 프로그래머이며 opencv C++를 사용하고 있습니다. 내가 작성한 프로그램의 일부로서, 나는 3 개의 중첩 된 것을 가지고있다. 첫 번째 이미지는 다른 이미지 용이고 두 번째 이미지 행과 세 번째 이미지 행입니다. 세 가지 사이에 어떤 의존성도 없으며 병렬로 도출 할 수 있습니다 (모든 이미지의 모든 픽셀을 병렬로 처리 할 수 ​​있음)

    2

    1답변

    금속 CNN 코드를 작성하고 있습니다. Metal은 MPSCNNLocalContrastNormalization, 을 제공합니다. 인스턴스 정규화의 개념이 약간 다르므로이를 커널 기능으로 구현하려고합니다. 그러나 문제는 각 R, G, B에 대한 평균 및 분산은 커널 기능에서 입력에서 수신 한 텍스처의 특징이 R, G, B 일 때 얻어야한다는 것입니다. 이것을

    0

    1답변

    NVidia Quattro 600 GPU가 올바르게 작동하고 있지만 nvidia-smi.exe를 실행하면 "불충분 한 권한"이 표시됩니다. 관리자 모드에서 명령을 실행 중이며 드라이버가 최신 상태입니다. 사용 권한 문제를 해결하려면 어떻게해야합니까? How to verify the usage of the GPU?에 언급 된 테스트를 실행하면 "CPU에서 실

    0

    1답변

    gpgpu 쉐이더에서 1000 입방 복셀, 약 10 억개의 부울은 약 1 기가 바이트의 메모리를 사용합니까? 리소스 제한 페이지는 GPU의 2 차원 및 3 차원 배열에 대한 인덱스 제한을 명시하지 않습니다. 그들은 이론적으로 수천 또는 수조에 있습니까?

    17

    1답변

    나는 nvidia-smi -l 1이 매초마다 GPU 사용법을 알려줄 것이라는 것을 안다. 그러나, 나는 Volatile GPU-Util이 실제로 의미하는 것에 대한 설명을 감사하게 생각합니다. 총 SM보다 사용 된 SM의 수 또는 점유율입니까? +--------------------------------------------------------------