nvidia

    0

    1답변

    전용 NVIDIA GPU가 설치되어 있어도 AMD gDEBugger 6 디버그 이상 OpenCL CPU 커널을 디버깅 할 수있는 방법이 있습니까? gDEBugger를 시작하면 다음과 같은 경고 메시지가 나타납니다. AMD GPU가 설치되어 있지 않습니다. 커널 디버깅이 비활성화됩니다. 글쎄, 난 그냥 ... CPU 커널을 디버깅 내 개발 환경을 원하는 :

    3

    1답변

    SlimDX 및 DirectX10 또는 11을 사용하여 nVidia 3D Vision Kit의 입체화 과정을 제어하려고합니다. 덕분에 question 나는 DirectX 9에서 작동하도록 만들었습니다. 그러나 일부 누락 된 메서드로 인해 DirectX 10 또는 11에서 작동하지 않게되었습니다. 알고리즘은 다음과 같습니다 : 것은 그들에게 여분의 행을 모두

    4

    2답변

    NVIDIA Fermi 아키텍처 (cuda의 doc 폴더에있는 Compute_profiler.txt 파일)의 성능 카운터 이름을 살펴보면 L2 캐시 실패의 경우 2 개의 성능 카운터 인 l2_subp0_read_sector_misses 및 l2_subp1_read_sector_misses. 그들은 L2의 두 조각을위한 것이라고 말했다. 두 개의 L2 조각이

    1

    1답변

    L2 캐시가 여러 커널 호출 사이에서 해제되는지 궁금합니다. 예를 들어 데이터에 대한 사전 처리 작업을 수행하는 커널과이를 사용하는 두 번째 커널이 있습니다. 데이터 크기가 768KB 미만인 경우 더 우수한 성능을 얻을 수 있습니까? 나는 NVidia 녀석들이 그렇지 않으면 구현할 이유가 없다고 생각하지만 어쩌면 내가 틀렸을 것입니다. 아무도 그 경험이 있

    2

    2답변

    아래는 CUDA에서 경쟁 조건이 어떻게 발생 하는지를 알기 위해 작성한 작은 프로그램이지만 출력에 놀랐습니다. #include<cutil.h> #include<iostream> __global__ void testLocal(int *something, int val[]){ *something = *something/2; val[threadIdx

    2

    1답변

    Visual Studio 2010 용 Parallel Nsight를 설치했습니다. 내 연구로 인해 NVIDIA 그래픽 카드가없는 컴퓨터에서 디버깅 할 수 없습니다. 따라서 서버 (서버에 연결)에서 디버깅하고 싶습니다. 가능합니까? 미리 감사드립니다.

    2

    2답변

    CPU 바이너리 검색 속도를 높이려고합니다. 불행히도, GPU 버전은 항상 CPU 버전보다 훨씬 느립니다. 아마도이 문제는 GPU에 적합하지 않거나 잘못된 것이 있습니까? CPU 버전 (약 0.6ms.) : 길이 2000 정렬 된 배열을 사용하여 특정 값을 ... Lookup (search[j], search_array, array_length, m);

    11

    1답변

    저는 Compute_Capability 2.0 장치 (GTX460)와 함께 CUDA 4.0 arch.를 사용합니다. 'cubin'과 'ptx'파일의 차이점은 무엇입니까? cubin이 gpu의 기본 코드이므로이 코드가 arch라고 생각합니다. ptx는 JIT 컴파일을 통해 Fermi 기기 (예 : Geforce GTX 460)에서 실행되는 중간 언어입니다.

    5

    3답변

    CUDA에서 블록 간 차단을 구현하려고하지만 심각한 문제가 발생합니다. 왜 작동하지 않는지 알 수 없습니다. 다음 __device__ void wait() { while(*count != 234124) ; } 프로그램으로 나는 대기를 다시 작성하는 경우에도 사실 #include <iostream> #include <cs

    13

    1답변

    로컬 메모리가 스레드 메모리 유형 인 레지스터 메모리보다 느리다는 것을 알게되었습니다. 공유 메모리는 빠르지 만 [스레드의] 로컬 메모리보다 빠릅니까? 내가 원하는 것은 중간 필터의 일종이지만 중앙값 대신 주어진 백분위 수를 사용합니다. 따라서 목록의 덩어리를 가져 와서 정렬 한 다음 적합한 목록을 선택해야합니다. 하지만 공유 메모리 목록을 정렬하거나 일이