cufft

    -2

    1답변

    현재 cuFFT 계획의 최대 128 백만 요소를 극복하기 위해 루프에서 다중 FFT를 실행하려고합니다. 그래서, 예를 들어 루프에서 1 억 2 천 8 백만 요소 실행을 실행합니다. 내 프로그램은 단일 FFT 호출에 잘 작동하지만 루핑이 작동하지 않는 것 같습니다. FFT를 어떻게 상쇄했는지 생각할 수 있습니다. 여기 내가 어떻게했는지에 대한 스 니펫이 있습

    1

    1답변

    저는 pyculib를 사용하여 Anaconda 3.5의 매트릭스에서 3D FFT를 수행합니다. 방금 웹 사이트에 게시 된 the example code을 따랐습니다. 그러나 나는 재미있는 것을 발견했고 그 이유를 이해하지 못합니다. 행렬을 만들 때 numpy.arange을 사용할 때만 pyculib 행렬에서 3D FFT를 수행하는 것이 정확합니다. from

    1

    1답변

    racecheck 도구가 내 응용 프로그램과 메모리 경쟁을보고했습니다. 나는 이것을 CUFFT exec 함수에 격리시켰다. 내가 잘못 했나요? 그렇지 않다면 어떻게하면 경주가 이것을 무시할 수 있습니까? 여기 는 cuda-memcheck --tool racecheck에서 실행할 때이 ========= Race reported between Write acc

    0

    1답변

    나는 nvidia-cuda-toolkit 패키지를 통해 설치된 CUDA 7.5 SDK를 사용하여 Ubuntu 16.04에 있습니다. cuFFT의 콜백 기능을 사용하여 간단한 테스트 프로그램을 컴파일하려고합니다. 예에 대한 소스 코드는 available at GitHub입니다. Following the instructions for compiling with

    0

    1답변

    Chromaprint라고하는 음향 지문 인식 라이브러리의 FFT 변환을 병렬 처리하려고합니다. "원본 오디오를 많은 겹치는 프레임으로 분할하고 푸리에 변환을 적용합니다." Chromaprint는 4096의 프레임 크기와 2/3의 겹침을 사용합니다. 예를 들어 첫 번째 프레임은 요소 [0 ... 4095]로 구성되고 두 번째 프레임은 [1366 .. 5462

    2

    1답변

    CUFFT callbacks을 사용하려면 코드를 재배치 가능 코드 relocatable device code으로 컴파일해야한다는 제한 사항 중 하나가 있습니다. 이 조건이 충족되지 않으면 나쁜 일이 발생합니다. 조용한 실패, 오답 등이 있습니다. 현재 빌드가 작동 중이지만이 코드는 이후 프로젝트의 잘못된 컴파일에 대해보다 강력하게 만들고 싶습니다. 컴파일

    5

    2답변

    cufftPlanMany을 사용하여 일괄 1D FFT를 계산하려고합니다. 데이터 세트는 1D 배열에 저장된 3D 필드에서 가져온 것이므로 x 및 y 방향의 1D FFT를 계산할 수 있습니다. 데이터는 아래 그림과 같이 저장됩니다. x에서 연속적이어서 y이면 z입니다. x- 방향의 일괄 FFT를 수행하는 것은 간단합니다. 입력이 stride=1, distan

    0

    2답변

    와 FFT를 사용하여 포아송 방정식 해결 : http://gpgpu.org/static/sc2007/SC07_CUDA_3_Libraries.pdf 해당 코드의 라인으로 라인을 따른 후, 정말 이상한 결과를 얻고 있습니다. 입력 데이터가 NxN이고 float입니다. 프로그램은 FFT 순방향 변환을 수행하고 푸 아송의 방정식을 풀고 역함수 FFT을 수행합니다.

    2

    1답변

    Matlab에서는 복소수의 1 차원 배열을 입력 할 때 같은 크기와 같은 차원의 실수로 배열을 출력합니다. CUDA C에서이 작업을 반복하려하지만 출력이 다릅니다. 도와주세요. [4.6500 + 0.0000i 0.5964 - 1.4325i 0.4905 - 0.5637i 0.4286 - 0.2976i 0.4345 - 0.1512i 0.4500 + 0.0000

    1

    1답변

    일부 FFT 및 역 FFT를 수행하기 위해 cuda 버전 7.5 cufft을 사용하고 있습니다. cufftExecC2R(.,.) 함수를 사용하여 역 FFT를 수행 할 때 문제가 있습니다. 실제로 에 batch_size = 1을 사용하면 정확한 결과를 얻습니다. 그러나 배치 크기를 늘리면 결과가 올바르지 않습니다. 설명하기 위해 샘플 최소 코드를 붙여 넣습니