cublas

    1

    1답변

    최근에 간단한 CUDA 행렬 - 벡터 곱셈을 사용하고 싶었습니다. 나는 cublas 라이브러리에서 적절한 기능을 발견했다 : cublas < < >> gbmv. 여기에 the official documentation 그러나 실제로는 매우 열악하므로 kl과 ku 매개 변수의 의미를 이해하지 못했습니다. 또한, 나는 무엇을 stride (그것은 또한 제공되어야

    2

    1답변

    기존 응용 프로그램을 병렬 처리하려고합니다. 대부분의 응용 프로그램을 병렬 처리하여 GPU에서 실행하고 있는데, 하나의 함수를 다음으로 마이그레이션하는 데 문제가 있습니다. GPU 이 함수는 blas 라이브러리의 일부인 dtrsv 함수를 사용합니다 (아래 참조). void dtrsv_call_N(double* B, double* A, int* n, int*

    7

    2답변

    CUDA 런타임에는 오류 열거 형을 읽을 수있는 문자열로 변환하는 편리한 기능 cudaGetErrorString(cudaError_t error)이 있습니다. cudaGetErrorString은 많은 사람들이 CUDA 오류 처리에 사용하는 CUDA_SAFE_CALL(someCudaFunction()) 매크로에서 사용됩니다. 지금 cuBLAS에 익숙해 져 있

    1

    1답변

    저는 CUBLAS 라이브러리를 탐색하려고하고 있으며 따라서 API를 사용하여 행렬 곱셈을위한 코드를 작성했습니다. 그러나 나는 이상한 결과를 얻고있다. 아래에 코드와 출력을 붙여 넣습니다. 도와주세요. #include<cublas.h> // Thread block size #define BLOCK_SIZE 3 #define WA 3 // Matri

    1

    1답변

    Ax = b를 해결하기 위해 사전 조율 된 구배 그래디언트를 사용하려고합니다. 그래서 나는 cuda-sdk로 주어진 샘플에 대해 예제를 취했습니다. 때로는 함수 cusparseScsrsv_analysis을 호출하면 "실행에 실패했습니다"라는 오류 6이 반환됩니다. 때로는 효과가 있습니다. 행렬 A는 대칭 양의 한정 값입니다. 또한 공액 그래디언트는 동일한

    3

    2답변

    내적의 CUBLAS 루틴을 사용하여 두 벡터의 내적을 계산하는 코드를 작성했지만 호스트 메모리의 값을 반환합니다. GPGPU에서만 추가 계산을 위해 내적을 사용하고 싶습니다. 어떻게 값을 GPGPU에만 상주시키고 CPU에서 GPGPU로 명시 적으로 복사하지 않고 추가 계산에 사용합니까?

    1

    1답변

    cloas의 cublasSaxpy 기능을 사용하려고합니다. 코드에서 봐 : #include <cublas_v2.h> float *dev_B; float *dev_tmp; cublasStatus_t stat ; cublasHandle_t handle ; ... ... stat = cublasCreate(&handle); if(stat !=

    3

    2답변

    CUBLAS를 사용하여 두 배의 범위에서 최대치와 최소치를 찾는 함수가 제대로 작동하지 않는 이유는 무엇입니까? void findMaxAndMinGPU(double* values, int* max_idx, int* min_idx, int n) { double* d_values; cublasHandle_t handle; cubla

    1

    1답변

    cglas와 atlas에서 모두 dgemm을 측정 한 것에 따르면 atlas는 속도 측면에서 cglas를 많이 상쇄합니다. Intel i7 950 및 Nvidia GTX470이 장착 된 시스템에서 예상되는 성능입니까? 크기가 10x10에서 6000x6000까지의 매트릭스를 50 단위로 테스트했습니다. Atlas가 항상 우승합니다. 나는 총 애플리케이션 실행

    9

    1답변

    cuBLAS 루틴을 비동기 적으로 호출하려고합니다. 가능한가? 그렇다면 어떻게 할 수 있습니까?