cublas

    3

    1답변

    그래서 일부 연구 결과 문제가 cublas 라이브러리에 있다고 밝혀진 후 그 오류를 내게 뱉어내는 프로젝트를 진행하고 있습니다. 나는 NVIDIA CUDA SDK (4.2) 밖으로 simpleCUBLAS 예를 열어 내가 문제를 재현 할 수 있는지 테스트하기 : 그래서 지금은 다음 "최소한의"문제가 있습니다. 자체가 작동하지만 VS2010 나에게 유사한 출력

    4

    2답변

    행렬 연산을 수행하기 위해 cuBLAS과 함께 CUDA를 사용하고 있습니다. 매트릭스의 행 (또는 열)을 합산해야합니다. 현재 나는 벡터에 행렬을 곱해서 행하고 있지만, 그렇게 효율적으로 보이지는 않습니다. 더 좋은 방법이 있습니까? cuBLAS에서 아무것도 찾을 수 없습니다. 감사합니다.

    1

    1답변

    cuda 커널 구현에 대한 질문이 있습니다. cuDoubleComplex 변수의 요소를 추가하려는 cude 커널을 생성했습니다. 나중에 요소에 대한 곱셈을 수행하려고합니다. 몇 가지 방법을 시도했지만 해결 방법을 찾을 수 없습니다. 내 함수이다 : 나는 NEWVALUE도 cuDoubleComplex입니다 result[tid]=result[tid]+newVa

    4

    1답변

    누울에 관한 일반적인 질문입니다. 단일 스레드의 경우 GPU에서 CPU (예 : cublasGetVector)로 메모리가 전송되지 않으면 cublas 커널 함수 (예 : cublasDgemm)가 자동으로 호스트와 동기화됩니까? cublasDgemm(); //cublasGetVector(); host_functions() 또한 인접한 두 개의

    3

    1답변

    동적 병렬 처리를 사용하여 CUBLAS를 cubin 파일로 실행하는 커널을 컴파일하려고합니다. 나는 그것을 잘 컴파일 -rdc=true 컴파일 옵션을 추가하면 내가 ptxas fatal : Unresolved extern function 'cublasCreate_v2 을 얻을 nvcc -cubin -m64 -lcudadevrt -lcublas_device

    0

    2답변

    나는 cuda에 초보자입니다. 나는 cuda 프로그램에서 cublas 기능을 사용하고 그것을 사용하는 방법에 대한 절차를 알고 싶습니다. GPU에서 실행하려고 할 때 * "cublas_v2.h 파일이 존재하지 않습니다"*라는 오류가 발생합니다.

    1

    1답변

    (벡터의 요소의 합을 얻기를위한) CUBLAS reference,는 aSum 기능에 따라 수 있습니다 : cublasStatus_t cublasSasum(cublasHandle_t handle, int n, const float *x, int incx, float *result) 당신은 참조 매개 변수 설명에 대한 링크에서 볼 수 대략적으로 우리는 x의

    0

    1답변

    "cudaHostAlloc"에 의해 할당 된 고정 메모리가 "malloc"메모리보다 장치에 더 효율적으로 전송 될 수 있음을 이해합니다. 그러나, 나는 "cudaHostAlloc"는 cuda 컴파일러에 의해서만 컴파일 될 수 있다고 생각합니다. 내 시나리오는 cuda 컴파일러없이 cublas API를 사용하는 것입니다. cloas는 핸드북에서 고정 메모리

    0

    1답변

    이상하게 들릴지 모르지만 상황이 CUDA4를 CUDA5로 업그레이드 한 후 내 자신의 커널이 더 빠르게 실행되고 있지만 cublas 함수 (예 : cublasDgemm)가 느려졌습니다. 또한, cublasDgemm 버전 5에서 일부 마그마 물건을 호출하는 것 같다. 그래서 "cudas"에 대해 버전 -5를 가져올 수있는 반면, "cudart"라이브러리에 대

    0

    1답변

    다음은 문제를 설명하는 최소한의 프로그램입니다. 내가 Windows에서 128 개 CUDA 코어와 CUDA 5.0을 GTS 250을 사용하고 7 void cuda_ops_test(int N, float* R) { //Values of input matrix in CPU fprintf(stderr, "\nValues of R: \n");