cuda

0열

1답변

numba를 사용하여 numpy 요소 식 행렬 곱셈과 같은 값을 얻을 수 없습니다.

numba를 사용하여 간단한 요소 식 행렬 곱셈을 구현하려고합니다. 'vectorize'를 사용할 때 나는 numpy 곱셈과 같은 결과를 얻었지만 'cuda.jit'을 사용할 때는 같지 않습니다. 그들 중 많은 수가 0입니다. 이 목적을 위해 최소한의 작업 예제를 제공하고 있습니다. 문제에 대한 도움을 주시면 감사하겠습니다. numba o.35.0 및 py

-2열

1답변

벤치 마크 CUDA with googlebenchmark 코어 덤프

google benchmark을 사용하여 일부 CUDA 코드를 벤치마킹하려고합니다. 우선 CUDA 코드를 작성하지 않았고 nvcc으로 컴파일 된 호스트 함수를 벤치 마크 할 수 있는지 확인하려고합니다. main.cu에서 나는 컴파일 #include <benchmark/benchmark.h> size_t fibr(size_t n) { if (n

-1열

1답변

루프에 대한 쿠다 커널 내에서 break 문이 발생합니다.

나는 최근에 쿠다/numba 코드를 가지고 놀고 있습니다. 나는 각 행이 누적 확률 분포 인 MxN 행렬 (말, cumul_A)을 가지고있다. 나는 일정한 랜덤 분포의 샘플을 매핑하여 누적 분포로부터 샘플을 그려보고자한다. 간단히 말하자면 균일 한 랜덤 분포에서 추출한 샘플은 0.3이라고 가정합니다. cuda 커널은 'cumul_A'행을 선택하고 행의 각

0열

1답변

__saturatef() intrinsic에는 동일한 배정 밀도가 없습니다.

Cuda는 intrinsic functions을 지원합니다. 일부는 일반적인 구문으로 표현할 수없는 퓨즈 된 다중 덧셈과 같은 장치 명령어에 매핑됩니다. 기타는 "표준"기능보다 빠르지 만 (잠재적으로 덜 정확하지만) 근사치입니다. 내재 형식의 후자 유형은 배정 밀도 인수 및 단 정밀도 부동 소수점에 대해서만 지원되는 것으로 보입니다. 의미가 있습니다 : 복

0열

1답변

CUDA hello_world not running

이 문제가 이전에 해결 되었으면 사과하지만 일부 검색을 수행하고 지금까지 빈 손으로 올랐습니다. 안녕하세요 세계의 쿠다 버전을 컴파일하려고하는데, 약간 수정하면 here입니다. // This is the REAL "hello world" for CUDA! // It takes the string "Hello ", prints it, then passes

-4열

1답변

Cuda GPP로드 백분율

GPU로드를 계산하고 싶습니다. cpu에서 gpu load percent를 얻는 방법은 무엇입니까? enter image description here

0열

1답변

GPU 장치에서 YUV 구성 요소를 얻으려면 어떻게해야합니까?

다음 프로그램은 Video_Codec_SDK_8.0.14의 NVIDIA NVTranscoder 프로젝트의 트랜스 코더 흐름을 보여줍니다. 디코더는 각 프레임을 NV12 형식으로 출력합니다. 그러나 코딩 과정에서받은 프레임은 Y 구성 요소 채널 만 가져오고, 어떻게 모든 YUV 구성 요소 채널을 가져올 수 있습니까? 게다가, 어떻게 처리 후 CUdevicep

-2열

1답변

어떻게 CUDA CPU 만 사용할 수 있습니까?

내 MacBook Pro에 "Intel Iris Graphics 6100"이 있으며 CUDA에서 지원하지 않습니다. 따라서 CPU 버전의 CUDA 만 사용하고 싶지만 공식 웹 사이트에서는 찾을 수 없습니다. 더 이상 지원되지 않습니까?

0열

1답변

OpenCV Cuda 첫 번째 cuda 호출에서 "invalid device function"

OpenCV를 gpu 지원으로 성공적으로 구축했지만 아직 해결할 수없는 상황이 있습니다. OpenCV 3.3을 VS 2013 및 CUDA 8.0으로 빌드 한 후 OpenCV CPU와 GPU는 내 테스트 기계 인 GTX 750 Ti와 GTX 950M (모두 Windows 10과 함께)에서 제대로 작동하는 것 같습니다. GTX 1050 Ti가있는 다른 컴퓨터에

0열

1답변

Xcode 및 CMake를 사용하여 CUDA 라이브러리 빌드

CMake를 사용하여 Xcode 프로젝트를 생성하고 CUDA 라이브러리를 빌드하려고합니다. 다음과 같이 내가 & 건물 CUDA 라이브러리 "caffe2_cpp_gpu"를 수집하기 위해 사용되는 코드는 다음과 같습니다 유닉스 메이크 파일을 사용하는 경우이 코드가 실행될 수 있습니다 list(APPEND CUDA_NVCC_FLAGS "-std=c++11" "-