gpu

    1

    1답변

    여기 코드는 GPU에서 실행되고 Windows 화면을 캡처하여 ID3D11Texture2D 리소스를 제공합니다. ID3D11DeviceContext::Map을 사용하여 GPT resource을 BYTE 버퍼에 넣고 BYTE 버퍼에서 CPU 메모리 g_iMageBuffer의 버퍼를 UCHAR으로 가져옵니다. 이제 리버스 엔지니어링을하고 싶습니다. g_iMag

    2

    2답변

    HPC 컴퓨팅과 관련된 용어에 완전히 익숙하지 않지만, EC2는 새로운 코어 유형 인 Cuda Core (5.120)와 두 가지 "코어"를 모두 갖춘 새로운 Nvidia Tesla V100으로 AWS에서 새로운 유형의 인스턴스를 출시 한 것을 보았습니다. , 텐서 코어 (640) 등이있다. 두 가지의 차이점은 무엇입니까?

    0

    1답변

    3D 데이터를 볼 수있는 새 탭을로드하기 전에 Chrome GPU 진단을 실행하고 싶습니다. 새 탭을로드하기 전에 일부 GPU 옵션이 켜져 있는지 확인하기 위해 진단 프로그램을 실행하고 싶습니다. 스크립트 또는 다른 방법을 통해 Chrome GPU 정보를 얻으려면 어떻게해야합니까?

    0

    1답변

    여기 실제 실수가 있습니다 - GPU에서 작동하는 tensorflow를 사용하여 CNN을 작성하려고 시도했지만 고생하고 있습니다 그것은 CPU와 코드가 잘 실행된다). 나는 GPU의 코드를 실행하면 device_name = "GPU:0" with tf.device(device_name): # Code here 일이 시작하지만 몇 초 후, 나는

    2

    1답변

    심 신경 네트워크 교육의 맥락에서 교육은 GPU를 처리 단위로 사용할 때 더 빠르게 작동합니다. 이것은 CudNN 최적화를 구성하고 (윈도우 파이썬 2.7 Keras)를 다음 행의 환경 변수의 처리 단위를 변경함으로써 수행된다가 os.environ["THEANO_FLAGS"] = "floatX=float32,device=gpu,optimizer_includ

    1

    0답변

    1D 데이터 집합이 여러 개의 세그먼트로 나누어지며 각 작업 항목은 하나의 세그먼트를 처리합니다. 세그먼트에서 개의 요소을 읽었습니까? 요소의 수는 미리 알려지지 않았으며 각 세그먼트마다 다릅니다. 예 모든 세그먼트들이 처리 된 후 +----+----+----+----+----+----+----+----+----+ <-- segments A BC

    0

    2답변

    예전 모바일 장치 (삼성 갤럭시 S4, 아이폰 5)에서 그림자가 활성화되어 게임이 너무 느리다 고 정의했습니다. 그림자를 끄면 성능이 크게 향상됩니다. 저속 장치에서 느린 GPU를 감지하여 그림자를 완전히 끄는 방법이나 그림자 성능을 향상시키는 방법을 알고 있습니까? 나는 렌더러에 조명에 diferrent shadow.mapSize 및 shadowMap.t

    1

    1답변

    GPU 작동 방식에 대한 정보를 검색합니다. 다른 소스에서 하드웨어 가속에 T & L (Transform and Lighting) 기술이 사용됨을 알게되었습니다. 예를 들어 다각형 조명을 계산합니다. 하지만 아시다시피 오늘날 개발자들은 프로그래밍 가능한 그래픽 파이프 라인을 사용하고 쉐이더별로 조명을 만듭니다. 오늘 T & L은 무엇을 위해 사용됩니까?

    3

    1답변

    메모리 매핑 된 I/O (mmap call on linux)를 사용하여 디스크의 파일에 액세스합니다. CL_MEM_USE_HOST_PTR (읽기 전용)을 사용하여이 가상 메모리 버퍼를 OpenCL에 전달할 수 있습니까? 그리고 이로 인해 성능이 향상 될 수 있습니까? 전체 파일을 호스트 메모리에 복사하는 것을 피하고 대신 OpenCL 커널이 파일의 어느 부

    2

    1답변

    18 페이지의 표 2 하단의 각주 뒤에 나오는 의미를 알고 싶습니다. Volta whitepaper. 볼타 전임자 유사한 SM 당 2백56킬로바이트 레지스터를 보유하는 테이블이 나타내고 있지만, 공간이 개선 SIMT 모델의 일부를 형성 당 사용 스레드 프로그램 카운터 (PC)는 일반적 두 필요하다고 언급 스레드 당 슬롯을 등록하십시오. Volta에서 실행중