Vulkan 계산 쉐이더 세트에서 특정 알고리즘을 구현하는 데 관심이 있습니다. 알고리즘은 한 지점에서 clz() 함수를 사용합니다. 내 NVIDIA GPU가 아마도이 기능을위한 하드웨어 지원을 제공 할 것으로 기대합니다. CUDA는 분명히 clz 명령을 사용하고 clz()도 OpenCL 1.2에 있습니다. 그래서 나는 내 자신의 clz()를 쓰고 싶지 않
지원 기능이 있지만 현재 OpenCL을 지원하지 않는 장치가 있다고 가정 해 보겠습니다. ISA, 하드웨어 설계 문서 및 기타 많은 문서가 있습니다. 현재 장치가있는 시스템에는 C 및 C++ 컴파일러가 있으며 많은 Linux 배포를 지원합니다. 이제 내 장치에 OpenCL (최신 버전 2.2라고 말하면 됨) 지원을 추가하고 싶습니다. 장치를 지원하려면 실제