한 번에 여러 개의 데이터를 호스트의 장치에 복사하거나 일련의 청크로 순서대로 복사하려면 알고리즘에 영향을 미칩니다. 내 질문은 어느 것이 더 많은 오버 헤드를 가지고 있는가? , 둘 이상의 복사 작업을 호출하는 것이 다른 것보다 더 많은 오버 헤드가 있다고 생각합니다. 그러나 나는 단지이 개념을 더 자세히 알고 싶다. (생각은은 일반적으로 현실과 맞지 않는다. :)). 문서 정렬에 대한 참조를 표시 할 수 있다면 정말 감사하겠습니다!한꺼번에 대량의 데이터를 전역 메모리에 복사하기 CUDA에서
친절 감사, 케르
당신이 "오버 헤드"를 말할 때, 당신은 고정 데이터 크기 독립적 인 지연, 또는 뭔가에 대해 물어? – talonmies
아니요! 전적으로 크기 독립적 (크기가 크거나 작은 것은 중요하지 않음). 호스트에서 장치로 복사 할 바이트 수가 N이라고 가정 해 봅시다. 내 질문은 어느 것이 더 빠릅니까? 한 번에 N 바이트를 모두 복사하거나 복사 (N/K), 복사 (N/K), 즉 K 회 복사 기능을 실행하는 일련의 청크로 복사합니다. 나는 후자가 훨씬 더 비싸다고 생각한다; 그러나 이전의 것보다 얼마나 더 비쌉니까? 일련의 바이트 청크로 복사하는 경우 한 번에 복사하는 것보다 비용이 1.2 배 높습니다. 그럼 내가 후자의 솔루션 (청크의 시리즈로 복사)에 대한 선택할 수 있습니다. – iliTheFallen