pycuda

    0

    1답변

    여기에 코드입니다 : import pycuda.autoinit import pycuda.gpuarray as gpuarray import pycuda.driver as drv import numpy as np import scikits.cuda.linalg as culinalg import scikits.cuda.misc as cumisc cu

    0

    1답변

    su 액세스 권한이없는 컴퓨터에서 Canopy enthought를 사용하고 있습니다. 나는이 오류가 파이썬에 의존하는 패키지를 빌드하려고 할 때마다 :는 는/usr/빈/LD : -lpython2.7 collect2 찾을 수 없습니다 : 명령 'g ++ : 신분증 1 개 종료 상태 오류 반환 '종료 상태 1에 실패했습니다. 무슨 일이 벌어 지는지 아십니까?

    0

    1답변

    전역 배열의 각 주소가 각 스레드에 4 번 쓰여지는 CUDA 커널이 있습니다. 워프의 두 스레드가 동시에 같은 주소에 쓸 수 있으므로 프로세스가 병합되지 않을 수 있습니다. 한 블록 내의 쓰레드는 어떻습니까? d_next_front[i*width + j+1] = 1; d_next[i*width + j-1] = 1; d_next[(i+1)*

    2

    1답변

    저는 파이썬에서 for 루프를 사용하여 GPU를 사용하고 싶습니다. 나는 간단한 해결책이 있어야한다고 생각하지만 아직 그것을 찾지 못했습니다. 우리 함수는 numpy 배열의 요소를 반복하고 그 결과를 다른 numpy 배열로 저장하는 수학을 수행합니다. 각 반복은이 결과 배열에 일부를 추가합니다. 우리의 코드의 수 많은 단순화은 다음과 같이 표시 될 수 있습

    -1

    1답변

    에서 PyCUDA 데모 예제 오류 (아래와 같이에있는 pycuda 런타임 오류가 발생했습니다). 예제를 실행 오류가 cordelia:examples xxx$ python demo.py Traceback (most recent call last): File "demo.py", line 3, in <module> import pycuda.

    0

    1답변

    지난 StackOverflow 질문 (예 : here 및 here)으로 판단하면 nvvp를 사용하여 PyCUDA 프로그램을 프로파일 링 할 수 있어야합니다. Unable to profile application. org.eclipse.core.rntime.CoreException: Reference to undefined variable args 사람

    8

    1답변

    현재 기계 학습 알고리즘의 성능을 향상시키기 위해 GPU 프로그래밍을 배우고 있습니다. 처음에 나는 순수한 C와 CUDA 프로그래밍을 배우려고, 나는 나에게 CUDA 라이브러리의 래퍼를 pycuda하는 발견하고 나는 theano 및 pylearn2 발견하고 혼란 조금 가지고 :이 방법으로 그들을 이해 : pycuda : CUDA 라이브러리에 대한 파이썬 래

    0

    1답변

    간단한 PyCuda OSX 응용 프로그램을 컴파일 할 수 없습니다을 > python test.py Traceback (most recent call last): File "test.py", line 12, in <module> """) File "/Library/Python/2.7/site-packages/pycuda-2013

    -5

    1답변

    드라이버 api를 사용하면 동일한 애플리케이션 ([1])에서 런타임 API의 사용을 배제합니다. 불행히도 cublas, cufft 등은 모두 런타임 API를 기반으로합니다. cuModuleLoad와 cublas 에서처럼 동적 커널 정의를 원할 경우, 옵션은 무엇입니까? 나는 이것을 염두에두고 있지만 어쩌면 더 많은 것들이 있습니다 : 가. 동일한 응용 프로

    1

    1답변

    저는 현재 pycuda와 scikits.cuda를 사용하여 선형 방정식 A * x = b를 풀고 있습니다. 여기서 A는 상한/하한 행렬입니다. 그러나 cublasStbsv 루틴에는 특정 형식이 필요합니다. 예를 들어, 더 낮은 행렬 A = [[1, 0, 0], [2, 3, 0], [4,5,6]]이면 cublasStbsv에 필요한 입력은 [[1, 3, 6],