gpu

1열

1답변

GPU 메모리 (ID3D11Texture2D 리소스)에 CPU 메모리 (UCHAR 버퍼)를 가져 오는 방법

여기 코드는 GPU에서 실행되고 Windows 화면을 캡처하여 ID3D11Texture2D 리소스를 제공합니다. ID3D11DeviceContext::Map을 사용하여 GPT resource을 BYTE 버퍼에 넣고 BYTE 버퍼에서 CPU 메모리 g_iMageBuffer의 버퍼를 UCHAR으로 가져옵니다. 이제 리버스 엔지니어링을하고 싶습니다. g_iMag

2열

2답변

쿠다 대 텐서 코어의 차이점은 무엇입니까?

HPC 컴퓨팅과 관련된 용어에 완전히 익숙하지 않지만, EC2는 새로운 코어 유형 인 Cuda Core (5.120)와 두 가지 "코어"를 모두 갖춘 새로운 Nvidia Tesla V100으로 AWS에서 새로운 유형의 인스턴스를 출시 한 것을 보았습니다. , 텐서 코어 (640) 등이있다. 두 가지의 차이점은 무엇입니까?

0열

1답변

스크립트 또는 다른 방법을 통해 Chrome GPU 정보를 얻으려면 어떻게해야합니까?

3D 데이터를 볼 수있는 새 탭을로드하기 전에 Chrome GPU 진단을 실행하고 싶습니다. 새 탭을로드하기 전에 일부 GPU 옵션이 켜져 있는지 확인하기 위해 진단 프로그램을 실행하고 싶습니다. 스크립트 또는 다른 방법을 통해 Chrome GPU 정보를 얻으려면 어떻게해야합니까?

0열

1답변

GPU에서 Tensorflow를 사용하면 커널이 인터럽트되어 "TensorFlow 바이너리가 컴파일되지 않았습니다. AVX AVX2"

여기 실제 실수가 있습니다 - GPU에서 작동하는 tensorflow를 사용하여 CNN을 작성하려고 시도했지만 고생하고 있습니다 그것은 CPU와 코드가 잘 실행된다). 나는 GPU의 코드를 실행하면 device_name = "GPU:0" with tf.device(device_name): # Code here 일이 시작하지만 몇 초 후, 나는

2열

1답변

런타임 동안 처리 단위를 변경하는 방법 (GPU에서 CPU로)?

심 신경 네트워크 교육의 맥락에서 교육은 GPU를 처리 단위로 사용할 때 더 빠르게 작동합니다. 이것은 CudNN 최적화를 구성하고 (윈도우 파이썬 2.7 Keras)를 다음 행의 환경 변수의 처리 단위를 변경함으로써 수행된다가 os.environ["THEANO_FLAGS"] = "floatX=float32,device=gpu,optimizer_includ

1열

0답변

OpenCL에서 부분 합계 계산

1D 데이터 집합이 여러 개의 세그먼트로 나누어지며 각 작업 항목은 하나의 세그먼트를 처리합니다. 세그먼트에서 개의 요소을 읽었습니까? 요소의 수는 미리 알려지지 않았으며 각 세그먼트마다 다릅니다. 예 모든 세그먼트들이 처리 된 후 +----+----+----+----+----+----+----+----+----+ <-- segments A BC

0열

2답변

three.js가 포함 된 모바일 장치에서 느린 GPU를 감지하는 방법은 무엇입니까?

예전 모바일 장치 (삼성 갤럭시 S4, 아이폰 5)에서 그림자가 활성화되어 게임이 너무 느리다 고 정의했습니다. 그림자를 끄면 성능이 크게 향상됩니다. 저속 장치에서 느린 GPU를 감지하여 그림자를 완전히 끄는 방법이나 그림자 성능을 향상시키는 방법을 알고 있습니까? 나는 렌더러에 조명에 diferrent shadow.mapSize 및 shadowMap.t

1열

1답변

T & L 기술은 더 이상 사용되지 않습니까?

GPU 작동 방식에 대한 정보를 검색합니다. 다른 소스에서 하드웨어 가속에 T & L (Transform and Lighting) 기술이 사용됨을 알게되었습니다. 예를 들어 다각형 조명을 계산합니다. 하지만 아시다시피 오늘날 개발자들은 프로그래밍 가능한 그래픽 파이프 라인을 사용하고 쉐이더별로 조명을 만듭니다. 오늘 T & L은 무엇을 위해 사용됩니까?

3열

1답변

OpenCL에서 메모리 매핑 된 파일 사용

메모리 매핑 된 I/O (mmap call on linux)를 사용하여 디스크의 파일에 액세스합니다. CL_MEM_USE_HOST_PTR (읽기 전용)을 사용하여이 가상 메모리 버퍼를 OpenCL에 전달할 수 있습니까? 그리고 이로 인해 성능이 향상 될 수 있습니까? 전체 파일을 호스트 메모리에 복사하는 것을 피하고 대신 OpenCL 커널이 파일의 어느 부

2열

1답변

볼타의 스레드 별 프로그램 카운터의 레지스터 사용량

18 페이지의 표 2 하단의 각주 뒤에 나오는 의미를 알고 싶습니다. Volta whitepaper. 볼타 전임자 유사한 SM 당 2백56킬로바이트 레지스터를 보유하는 테이블이 나타내고 있지만, 공간이 개선 SIMT 모델의 일부를 형성 당 사용 스레드 프로그램 카운터 (PC)는 일반적 두 필요하다고 언급 스레드 당 슬롯을 등록하십시오. Volta에서 실행중