pycuda

    0

    1답변

    나는 여기에있는 코드를 적용하려고합니다 : https://wiki.tiker.net/PyCuda/Examples/ThrustInterop ... cuda 스트림을 사용합니다. 가 (필자는 C++에 새로 온 것을 변명, 단지 CUDA와 몇 주 경험을하시기 바랍니다.) 내 주요 시도 및 부착 지점이 같은 NVCC 기능을 조정하는 라인을 따라왔다 그래서 수신 추

    2

    1답변

    PyCUDA를 사용하여 GPU에서 실행할 수있는 두 개의 배열에 대한 동일성 검사기를 만들려고합니다. PyCUDA GPU Arrays documentation page에 주어진 예제에 따라 필자는 자신의 구현을 작성하려고 시도했습니다. 그러나 아래 코드는 산술에 예상대로 작동합니다 (예 : "z[i] = x[i] + y[i]"이면, 동등 검사기 피연산자 "

    1

    1답변

    다음과 같은 코드는 작동하지 않습니다. 이유를 이해하고 싶습니다. 내가 가진 오류가 있습니다 : "형식 오류 : 매개 변수 # 3에 유효하지 않은 유형 (0 기반)" 그리고 오류가 함수 내 전화의 블록 라인에서 발생합니다. 코드에서 따라서 끝까지 두 줄로 block = (MATRIX_SIZE,MATRIX_SIZE,1) 줄입니다. 여기에 실수가 무엇인지 아는

    0

    1답변

    PyCuda 코드를 수행하고 있는데 그래픽 카드의 속성 (워프 크기, 블록 당 최대 스레드 수 등)을 얻고 싶습니다. 그래서 나는이 페이지에 갔다 : https://documen.tician.de/pycuda/driver.html 그리고 나는이보고 다음 가 그럼 난 내 코드에 쓴이 : import time import numpy as np from py

    2

    1답변

    내 시스템입니다 : 시스템 환경 : 윈도우 7 프로페셔널 아나콘다 3 파이썬 3.5.4 GPU : Quadr K2200 드라이버 : 353.90 CUDA 툴킷 : 7.5 비주얼 스튜디오 : Visual Studio 커뮤니티 2013 (일본어판) pycuda installa에 사용 된 바이너리 파일 기 : pycuda-2016년 1월 2일 + (http://

    0

    1답변

    현재 PyCUDA를 사용하여 고정 메모리가있는 내적 제품을 작업하고 있습니다. 그리고 큰 배열에 문제가 있습니다. 내가 함께 일하고 있어요 : NVIDIA의 GTX는 1060 CUDA 9.1 PyCUDA 2017년 1월 1일 코드는 다음과 같습니다 #!/usr/bin/env python import numpy as np import argparse

    0

    1답변

    우리는 4 개의 GPU 장치 만 가지고 있습니다. 우리는 4 명 이상의 사용자가 cuda 프로그램을 실행할 수 있으므로 프로그램을 실행하기 전에 어떤 장치가 사용 중이 아닌지 확인하거나 메모리를 할당하지 못하게 할 것입니다. 그러나 나는이 태그를 얻는 함수를 발견하지 못했습니다. 우리가 "cudaSetDevice()"라고 부르는 장치를 사용하고자 할 때,

    1

    1답변

    저는 CUDA 프로그래밍을 위해 pyCUDA를 사용하고 있습니다. 커널 함수 내에서 난수를 사용해야합니다. CURAND 라이브러리가 내부에서 작동하지 않습니다 (pyCUDA). GPU에서 수행해야 할 작업이 많으므로 CPU에서 임의의 번호를 생성 한 다음 GPU로 전송하면 GPU를 사용하는 동기가 사라지게됩니다. 보충 질문 : 1 개 블록 1 개 실을 사용

    1

    1답변

    나는 cuda와 pycuda에 대해 매우 새로운 기술이다. 동일한 배열을 n 번 단순히 "반복"함으로써 배열 (1xd)의 행렬 (차원 nxd)을 만드는 커널이 필요합니다. 예를 들어, n = 4 및 d = 3이라고 가정하면 배열 [1 2 3] 인 경우 내 커널의 결과가 같아야 [1 2 3 1 2 3 1 2 3 1 2 3] (4x3의 행렬). 나는이

    -1

    1답변

    저는 GPU에서 이미지 용 로컬 바이너리 패턴을 계산하려고했는데, 파이썬에서 동일한 방식으로 cuda 모듈을 사용했습니다. 그러나 CPU와 GPU에서 비슷한 알고리즘을 실행하면 결과가 달라집니다. 문제를 이해하도록 도와 주시겠습니까? 다음은 에 코드 내가 실행하려고하고 있습니다 : from __future__ import division from skim