cublas

    1

    1답변

    나는 GPU 메모리에 큰 밀도 벡터 (안 매트릭스)이 있습니다 [1,3,0,0,4,0,0] 및 스파 스로 변환 할 형식 : 값 = [1,3,4]; 지수 = [0,1,4] 내가 cuSPARSE에 cusparse<t>dense2csc()를 호출 할 수 있습니다 알고 있지만 그 행렬 설계, 및 벡터에 대한 효율적인하지 않을 수 있습니다. 이것을 할 수있는 다른

    0

    1답변

    2D 매트릭스에서 확산을 시뮬레이션하는 간단한 CUDA C++ 프로그램을 작성했습니다. Toolkit에서 제공되는 라이브러리 중 일부를 사용하려고 할 때 문제가 발생했습니다. 내 매우 비효율적 인 행렬을 cuBlas에서 무언가로 바꾸고 싶다. 또한 implCU를 선형 시스템을 해결하는 cuSolvers 구현으로 대체하고 싶다. 문제는 내가 함수를 사용하거나

    0

    1답변

    나는 Matlab에서 Nvidia GPU에서 실행되도록 일부 코드를 이식하고 있습니다. 나는 다음을 수행 할 수있는 방법을 알아낼 수 없습니다 : A와 B는 행렬이다 B = max(A, 0) . 말하자면, 행렬의 음수 값을 0으로 대체해야합니다. 커널 함수를 작성하는 방법을 알고 있지만 가능한 경우 cuBLAS 또는 magma 호출을 사용하고 싶습니다

    0

    1답변

    Alea GPU에서 행렬 곱셈에 Gemm을 사용하려하지만이 코드는 잘못된 결과를 제공합니다. Gpu gpu = Gpu.Default; Blas blas = new Blas(gpu); int m=2,n=3; //in dimension and out dimension (output will be mxn matrix) int k=4; //column

    0

    1답변

    현재 Nvidia Jetson TX1/2에서 개발 중입니다. 내 코드의 가장 느린 부분은 (변수 이름 읽기 쉽도록 변경)입니다 : .... cv::Mat A, B; GpuMat_A.download(A, Cuda_stream); GpuMat_B.download(B, Cuda_stream); double C = A.dot(B); B = B.inv()

    0

    1답변

    저는 GPU를 처음 접했고 GPU를 사용하여 큰 행렬 벡터 곱셈을 풀고 싶습니다. 행렬이 줄무늬 행렬이므로 "cublasDgbmv"를 사용하여 문제를 해결하려고합니다. 간단한 예제로이 명령을 구현하려고했습니다. 내가 가진 /* system of equations sol=A*b: A=[1 2 3 0 0 0 2 -1 4 1 0 0 3

    0

    1답변

    코드에서 추력 라이브러리의 복소수 배열을 사용하며 배열을 조 변경하려면 cublasZgeam()을 사용하고 싶습니다. cuComplex.h에서 복소수를 사용하는 것은 바람직한 옵션이 아닙니다. 배열에서 산술 연산을 많이하고 cuComplex가 * + =와 같은 연산자를 정의하지 않았기 때문입니다. 컴파일 할 때 #include "cuComplex.hpp"

    0

    1답변

    tensorflow에 익숙하지 않으며 공유 Linux (Ubuntu 16.04)에서 작업 중입니다. 루트 액세스. Cuda 8.0과 Cudnn 8은 이미 admin에 의해 root로 설치되어 있습니다. 아나콘다를 사용하여 python 3.5를 설치 한 다음 pip를 사용하여 tensorflow를 설치했습니다. 다음 내보내기를 사용하여 PATH 및 LD_PA

    1

    1답변

    안녕하세요 저는 cuda 8.0을 설치했으며 주어진 cuda 예제를 컴파일했습니다. matrixMulCUBLAS 예제를 실행하려고했지만 다음 오류가 발생합니다. ./matrixMulCUBLAS [Matrix Multiply CUBLAS] - Starting... GPU Device 0: "GeForce GTX 1080 Ti" with compute ca

    1

    1답변

    Ubuntu Linux 16.04에서 Python 2.7.14의 ctypess를 사용하여 CUDA 9.0에서 cublasXt*gemm 함수를 래핑하려고합니다. 이 함수는 호스트 메모리에있는 배열을 인수로 받아들입니다. 그러나 #include <iostream> #include <cstdlib> #include "cublasXt.h" #include "