gpu-programming

    5

    3답변

    나는 진짜 수정 프로그램입니다. 도와주세요. 그것은 급해. 나는 다중 호스트 (CPU) 스레드 (pthreads)를 생성하는 호스트 프로세스를 가지고있다. 이 쓰레드는 차례로 CUDA 커널을 호출합니다. 이 CUDA 커널은 외부 사용자가 작성합니다. 따라서 무한 루프로 들어가는 나쁜 커널 일 수 있습니다. 이를 극복하기 위해 해당 CPU 스레드를 죽일 2

    3

    1답변

    CUDA/MPI 프로그래밍 등을위한 최고의 IDE/IDE 플러그인/도구는 무엇입니까? 나는 잠시 동안이 프레임 워크에서 작업 해 왔지만 IDE가 확장 및 작업 처리 상호 작용 관점에서 더 많은 작업을 수행 할 수 있다고 생각합니다.

    1

    2답변

    CUDA SDK를 컴파일 할 때 nvcc가 치명적입니다 : 지원되지 않는 GPU 아키텍처 'compute_20'내 툴킷은 2.3이며 공유 시스템 (예 : 정말 업그레이드 할 수 없음) 및 드라이버 버전도 2.3이며, 4 대의 Tesla C1060을 실행 중입니다. 문제가 해결되면 radixsort에서 문제가 호출됩니다. 몇 사람이 온라인에이 문제가 있지만

    2

    1답변

    저는 HP Pavilion Laptop을 가지고 있습니다. 그래픽 카드는 공유 메모리에서 실행되는 일종의 통합 NVIDIA 드라이버입니다. 비디오 게임이 지난 5 년간 2 백만 달러가 넘는 비용으로 만들어 졌다면 컴퓨터에서 재생할 수 없을 것입니다. 어쨌든, 저는 CUDA와 같은 GPU 프로그래밍을 할 수 있을지 궁금합니다. 나는 그것이 빠르기를 기대하지

    3

    3답변

    당신은 어떻게 생각하십니까? 더 빨라지고 빨라지는 것은 무엇입니까? GPU 또는 CPU (다중 스레드)에서 스파 스 매트릭스 (CSR) 곱셈 (벡터 사용)을 수행하고 있습니까?

    2

    2답변

    저는 소프트웨어 정의 된 라디오 개념을 실험하려고합니다. 이 article에서 GPU 병렬 처리 이산 푸리에 변환을 구현하려고했습니다. 저는 죄의 90도 (i)를 미리 계산할 수 있다고 확신합니다. 그리고 나서이 코드에서 내가하고있는 일보다 플립 앤 플렉스를 반복하여 속도를 높일 수있을 것이라고 확신합니다. 그러나 지금까지 나는 정답을 얻고 있다고 생각지

    0

    1답변

    플래시 10의 GPU 가속 기능의 범위를 파악하려고합니다. 코드 GPU의 100 %를 가속화 할 수 있습니까? 아니면 특정 샌드 박스 기능 만 있습니까? 브라우저 외부에서 브라우저를 가져와야하거나 브라우저에서 얼마나 많은 GPU 가속을 얻을 수 있는지 정확히 알 필요가 있습니다. 좋은 기사에 대한 링크는 훌륭합니다.

    5

    1답변

    저는 GPU 프로그래밍의 초보자입니다. 브룩 + 언어를 사용하여 ATI 스트림 프로세서에서 무차별 RAR 암호 복구를하고 있지만 브룩 + 언어로 작성된 커널은 그렇지 않습니다. (커널 기능 제외) 정상적인 기능에 대한 호출을 허용, 내 질문은 : 1) unrar.dll (unrar 아카이브 파일) API를 사용하는 방법이 상황에서 API를? 이것이 RAR

    4

    2답변

    GPU에 cl_mem 버퍼를 할당하고 있습니다. 특정 크기를 초과 할 때까지 제대로 작동합니다. 이 경우 할당 자체는 성공하지만 실행 또는 복사는 성공하지 못합니다. 나는 더 빠른 작업을 위해 장치의 메모리를 사용하여 다음과 같이 할당하고 싶습니다. buf = clCreateBuffer (cxGPUContext, CL_MEM_WRITE_ONLY, buf_s

    7

    1답변

    정렬 할 배열에는 약 백만 개의 문자열이 있으며 모든 문자열의 길이는 최대 100 만 자까지 가능합니다. GPU를위한 정렬 알고리즘의 구현을 찾고 있습니다. 크기가 약 1MB 인 데이터 블록이 있으며 suffix array을 생성해야합니다. 이제는 백만 가지의 문자열을 실제로 소량의 메모리 안에 둘 수있는 방법을 알 수 있습니다.