pycuda

    4

    2답변

    참고로 파이썬 2.7의 64 비트 버전과 을 사용했으며 pycuda를 설치하려면 the pycuda installation instruction을 따라갔습니다. 그리고 다음 스크립트를 실행하는 데 아무런 문제가 없습니다. 이 문을 실행하면 import pycuda.driver as cuda import pycuda.autoinit from pycuda.

    1

    1답변

    나는 지침 here을 따랐습니다. http://www.lfd.uci.edu/~gohlke/pythonlibs/ (모두 최신 패키지)의 패키지를 모두 설치했습니다. 성공적으로 설치 한 것 같습니다. 나는 Ipython에서 아래의 코드 실행 : import pycuda.gpuarray as gpuarray import pycuda.driver as cuda

    1

    2답변

    PyCUDA 라이브러리를 사용하여 GPU 컴퓨팅을 수행하는 Python 패키지를 작성하고 있습니다. PyCUDA는 서브 모듈을 가져 오기 전에 GPU 장치를 초기화 (보통 pycuda.autoinit 가져 오기)해야합니다. 제 자신의 모듈에서 필자는 PyCUDA에서 필요한 모든 서브 모듈과 함수를 가져옵니다. 즉, 내 모듈은 PyCUDA를 처음 초기화하지

    0

    1답변

    저는 PykUDA와 Scipy의 ODEInt을 사용하여 단백질 집합 모델을 프로그래밍하려고하는 생물 물리학 대학원생입니다. 지난 2 주 이내에 코드를 실행했지만 매우 느립니다. 내 코드가하는 일을 설명 할 수 있는지 알아 보겠습니다. np 배열은 각각 N이고, 각 요소는 길이 중합체의 농도이다. 나는 CUDA을 사용하여 폴리머 농도의 변화율을 계산하는 함수

    0

    1답변

    : 을 나는 특별한 매트릭스 - 벡터 곱셈에 대한 작업 커널이있는 나는 속도를 높이고 싶다. 기본적으로 큰 행렬 (10^6 × 10^6)은 소수의 작은 행렬로 구성됩니다. 그래서이 데이터를 공유 메모리에 저장하려고합니다. pycuda._driver.LogicError : 내가 공유 메모리를 추가 할 때 그러나, 나는 단지 오류가 cuLaunchKernel

    0

    1답변

    동적 병렬 처리에 문제가 : Traceback (most recent call last): File "C:\temp\GPU Program Shell.py", line 22, in <module> """) File "C:\Python33\lib\site-packages\pycuda\compiler.py", line 262, in _

    2

    1답변

    저는 cuda에서 블록 및 격자가 어떻게 작동하는지 확고히 파악하지 못했습니다. 나는 각 요소를 값으로 채우고 채우고 싶은 1000x10 행렬을 가지고있다. 커널은 다음과 같이이다 : __global__ void myfun(float *vals,float *out, int M, int N) { int row = blockIdx.y*blo

    1

    1답변

    나는 pycuda에서 작동하는 결투 방식의 결합 메소드를 가지고 있습니다. 그것은 하나의 gpuarray.dot() 호출 융합 지출까지 자기 기록 매트릭스 - 벡터 곱셈과 kernprof.py/line_profiler으로 프로그램을 프로파일 링 pycuda 네이티브 gpuarray.dot 및 gpuarray.mul_add 기능 대부분의 시간을 반환 (> 6

    0

    1답변

    나는 약 9000 개의 결합 된 ODE를 해결하는 pycuda를 사용하여 빌드하려고 시도하고있는 모델에 대해 오래 전부터 게시했습니다. 그러나 내 모델은 너무 느리며 SO 회원은 호스트에서 GPU 로의 메모리 전송이 아마도 범인이라고 제안했습니다. 지금 당장 cuda는 내가 다루고있는 9000 종의 변화율을 계산하는 데에만 사용되고 있습니다. 이 계산을 수

    1

    1답변

    PyCUDA 설명서, 샘플 및 Kirk와 Hwu의 CUDA에 대한 책을 읽은 것을 토대로 CUDA C 기반의 복잡한 행렬 곱셈 프로그램을 성공적으로 구현했으며 PyCUDA에 버전을 작성했습니다. C 코드는 정확한 결과를 산출하지만 파이썬 코드는 그렇지 않습니다. 파이썬 코드는 단순히 샘플 (MatrixMulTiled)에서 가져온 것으로, "cuComplex