pycuda

    4

    4답변

    저는 CUDA를 사용하여 이미지를 처리하는 프로젝트에 있습니다. 프로젝트는 단순히 이미지를 더하거나 뺍니다. 나는 귀하의 전문적인 의견을 물어볼 수 있습니다. 어떤 것이 가장 좋으며 그 두 가지의 장단점은 무엇입니까? 이 프로젝트가 저에게 아주 중요하기 때문에 모든 사람의 의견 및/또는 제안에 감사드립니다.

    4

    1답변

    질문에 다소 차이가 있습니다. calling a host function("std::pow<int, int> ") from a __device__/__global__ function("_calc_psd") is not allowed 제 생각에 이것은 cuda pow 함수를 대신 사용해야하지만 그렇지 않습니다.

    0

    1답변

    분당 구리 헤드와 관련된 두 가지 문제점이 있습니다. 샘플 파일 (samples/axpy.py)을 실행하면 약간의 경고가 발생했지만이 파일은 두드러졌습니다. g++ -pthread -fno-strict-aliasing -g -O2 -g -fwrapv -O2 -Wall -fPIC -pthread -shared -Wl,-O1 -Wl,-Bsymbolic-func

    1

    2답변

    장치에 생성 된 데이터 (A [i, j, k])의 큰 덩어리가 있지만 A [i, :, :]의 하나의 '슬라이스'만 필요하며 일반 CUDA에서는 일부 포인터 연산으로 쉽게 수행 할 수 있습니다. pycuda 내에서 동일한 작업을 수행 할 수 있습니까? 즉 cuda.memcpy_dtoh(h_iA,d_A+(i*stride)) 는 분명히 이것은합니다 (이명 령

    6

    1답변

    PyCUDA의 설명서에 Driver Interface 호출에 대한 언급이 있지만 약간 생각하고 코드에서 'SHARED_SIZE_BYTES'과 같은 정보를 얻는 방법을 볼 수 없습니다. 누구든지이 방법으로 장치를 쿼리하는 예제를 알려줄 수 있습니까? 일부 컴퓨터 동적 작업을 구현하기 위해 장치 상태 (예 : malloc/memcpy와 커널 시작)를 검사 할

    1

    1답변

    PyCUDA는 결함과 관련하여 위키에서 제공되는 매우 훌륭한 예제를 가지고 있으며 위키에서 다운로드 할 수 있습니다. 그러나 필자는 PyCUDA 방식으로 여러 기기에 작업 부하를 역동적으로 할당하는 방법을 보여주는 예제 나 문서 (또는 간단한 Google 검색)에서 아무 것도 찾을 수 없었습니다. 아무에게도 내가해야 할 일을 암시하거나 예제를 가르쳐 줄 수

    3

    1답변

    올바른 매개 변수를 prepare function (및 prepared_call)에 allocate of shared memory in PyCUDA으로 전달하는 데 문제가 있습니다. 이런 식으로 오류 메시지를 이해합니다. PyCUDA에 전달하는 변수 중 하나가 float32이 아닌 long입니다. 그러나 나는 변수가 어디서 왔는지를 볼 수 없다. 또한 of

    2

    1답변

    나는 pycuda 앱을 간단하게 테스트하고 프로필을 작성하려고합니다. 나는이 오류를 방출, 프로그램 11 번을 실행 NVIDIA의 계산 비주얼 프로파일 러를 시도했다 : NV_Warning: Ignoring the invalid profiler config option: fb0_subp0_read_sectors Error : Profiler data fi