저는 CUDA 최적화에 대해 배우고 있습니다. 이 링크의 프레젠테이션을 발견했습니다 : Optimizing CUDA by Paulius Micikevicius. 이 프레젠테이션에서 CUDA : 메모리 성능, 전체 메모리 대역폭은 무엇입니까
, 그들은 약MAXIMIZE 글로벌 메모리 대역폭
, 그들은 글로벌 메모리 유착이 대역폭을 향상시킬 것이라고 이야기한다.
내 질문에, 어떻게 전역 메모리 대역폭을 계산합니까. 누구든지 간단한 프로그램 예제를 통해 나를 설명 할 수 있습니까?
http://stackoverflow.com/questions/7876006/how-to-calculate-the-achieved-bandwidth-of-a-cuda-kernel? – pQB