GPU에서 일반 컴퓨팅을 수행하기 위해 DirectCompute를 사용하고 있습니다. 현재, 해상도 1920x1080의 텍스처를 조작하려고합니다. 디스패치 (2, 1080, 1)와 numthreads (960, 1, 1)를 가지고 있습니다. 계산에 따르면 픽셀 당 하나의 스레드로 정확하게 이미지가 덮여 있습니다. 이제 알겠지만 모든 스레드가 동시에 실행되어
OpenCL과 DirectCompute 사이의 비교를 찾고 있지만 아무것도 찾지 못했습니다. OpenCL은 크로스 플랫폼이면서 지원되는 GPU가 더 넓다는 이점이 중요하지 않습니다. Windows에서 DX11 GPU에 대해서만 코딩하는 것이 좋습니다. 각 API의 장단점은 무엇이라고 생각하십니까? 나는 this question was raised befor
저는 교육을 위해 DirectCompute에서 간단한 경로 추적 프로그램을 작성하고 있습니다. 다이렉트 재귀 기능을 허용하지 않는, 그래서 루프에이 재귀 문을 설정하는 방법을 파악해야합니다 일반 의사 코드 또는 C의 예를 정말 감사하겠습니다 intersectCode() {
// ... intersection code
if(hit an
GPU 컴퓨팅에 잘 맵핑해야하는 (재정적 인) 작업이 몇 가지 있습니다.하지만 OpenCL 또는 DirectCompute를 사용해야하는지 잘 모르겠습니다. GPU 컴퓨팅을 해봤지만 오래 전 (3 년)이었습니다. 그 당시에는 OpenGL을 통해 해냈습니다. 일부 OpenCL 프레젠테이션을 보았는데 정말 멋지게 보입니다. DirectCompute에 대해서는 아
저는 광산 프로젝트의 일부로 GPU를 사용하려고했습니다. 저는 CUDA와 OpenCL을 모두 살펴 보았습니다. 그러나 이것들을 프로젝트에 소개하는 방법을 보여주는 정보가 부족하다는 것은 충격적입니다. 그들의 헌신적 인 포럼 그룹조차도 죽었다. 이제 DirectCompute를 살펴 보겠습니다. 내가 알 수있는 것부터, 단순히 HLSL을 사용하는 셰이더 파일의
입자 시뮬레이션을하고 있고 병목 현상이 조금 있습니다. UAV를 사용하여 RW 쓰기가 가능합니다. 단일 플로트 버퍼가 약 10 배 정도 느립니다. 실험에서 대역폭의 부족은 없지만 액세스 시간 자체만으로는 부족한 것으로 보입니다. 나가는 데이터가 특정 순서로 있어야하기 때문에 글을 적어 두는 것이 좋습니다. 이것은 DX10/SM4 하드웨어에 있습니다. 몇 가
C++ AMP가 DirectX 11을 지원하는 GPU에 의해 가속된다는 것을 알고 있습니다. 그러나 컴파일 된 C++ AMP 프로그램이 DirectX 11 호환 GPU가없는 컴퓨터에서 실행되는 경우 어떻게됩니까? DirectCompute의 일부 소프트웨어 구현에서 에뮬레이트됩니까? CPU에서 실행됩니까 (SSE 스타일 지침 사용)? 아니면 그냥 실행에 실패
을 사용하는 AES 암호화/암호 해독에 대한 샘플 코드는 DirectCompute (HLSL 소스 코드 포함)를 사용하는 AES 암호화/암호 해독 (모든 유형)의 구현에 대해 알고 있습니까? GPU에서 AES에 대해 논의한 몇 가지 논문을 읽었으며 CUDA 또는 OpenCL을 참조하는 경향이 있습니다. 저는 DirectCompute로 옮기는 것을 배우는 것
DirectX Compute Shader에서 groupshared 메모리를 사용하여 전역 메모리 대역폭을 줄이고 성능을 향상 시키려합니다. 내 입력 데이터는 Texture2D 내가과 같이 2D 인덱스를 사용하여 액세스 할 수 Input[threadID.xy]
는 I 입력 데이터의 일부를 캐싱 공유 메모리의 2 차원 배열을 갖고 싶다 그래서 명백한 시도