내 Pycuda 코드에서 구조체를 구현하려고하는데 경계 오류가 발생합니다. this 튜토리얼을 따르려고했지만 내 경우에는 제대로 작동하지 않습니다. 문제는 대부분 포인터의 부적절한 사용으로 인한 것일 수 있습니다. 이 튜토리얼에서는 memsize 포인터가 데이터 memsize보다는 할당되어야 함을 보여줍니다. 바라건대 여기 누군가가 나에게 약간의 통찰력을
저는 Python으로 CUDA 및 3D 텍스처를 사용하고 있습니다 (pycuda 사용). Memcpy3D이라는 기능이 있으며 여기에는 Memcpy2D과 몇 가지 추가 기능과 동일한 멤버가 있습니다. 그 안에는 width_in_bytes, src_pitch, src_height, height 및 copy_depth과 같은 것을 설명하기 위해 호출합니다. 이것
내가 작업하고있는 프로젝트에서 키의 일부가 주어진다면 AES로 암호화 된 암호문을 해독해야합니다. 암호문의 나머지 키 공간은 2^40입니다. 저는 CUDA (GPU 코어를 통해 키 공간을 나눕니다)를 사용하여 암호 해독을 실행하고 싶지만 적합한 CUDA AES 라이브러리를 찾을 수없는 것 같습니다. 커널에서 C AES 라이브러리 복호화를 실행하는 것과 같은
np.array 또는 np.zeros 또는 np.empty(shape, dtype)을 사용하여 호스트 내 전역 장치 기능을 작성한 다음 cuda.to_device을 사용하여 복사하는 방법을 알고 있습니다. 또한 하나 cuda.shared.array(shape, dtype) 하지만 어떻게 GPU 함수 내부 특정 스레드의 레지스터에 일정한 크기의 배열을 생성하
Struts2를 사용하여 웹 사이트를 디자인했습니다. 이제 이미지 처리가 수행되는 함수를 호출해야합니다. 그 때문에 나는 pycuda을 사용하기로 결정했습니다. 어느 누구나 pycuda를 설치하기위한 단계와 의존성을 말해 줄 수 있습니까? (나는이 코드를 액션 파일에서 호출해야한다). 자이 썬도 필요합니까? centOS을 사용하고 있습니다.
의는 우리가 같은 두 개의 호출을 사용하여 장치에 같은 양의 메모리를 할당한다고 가정 해 봅시다 : pointerA = cuda_driver.mem_alloc(myArray.nbytes)
pointerB = cuda_driver.mem_alloc(myArray.nbytes)
그런 다음 우리는 모두 DeviceAllocation 개체에 대한 장치에 동일
저는 PyCuda를 사용하여 유전자 세포 자동화를 개발 중입니다. 각 셀에는 셀 매개 변수와 함께 많은 게놈 데이터가 있습니다. 1) 셀 데이터를 CUDA 커널에 전달한 다음 2)이 데이터를 처리하는 가장 효율적인 방법이 무엇인지 궁금합니다. 필자는 특히 나쁜 해결책으로 시작했지만 여전히 해결책이되고 있습니다. 그것은 각 매개 변수를 별도의 배열로 전달한
저는 CUDA 프로그래밍을 처음 접했고 PyCUDA로 시작하여 기초를 닦기 시작했습니다. 튜토리얼을 공부하고 몇 가지 간단한 테스트 코드를 실행했습니다. 테스트에서는 1D 배열 만 사용했습니다. 2D 배열로 다음 코드를 실행하려고 시도했을 때 정렬되지 않은 주소로 인해 정리 작업이 실패했다는 PyCUDA 경고가 계속 발생했습니다. import pycuda.