이 코드를 작성했습니다 : app 및 cova는 코드 및 gsingle에서 변수 dim와 동일한 차원의 행렬입니다. dim=32;
gfor q=1:256
app(:,:,q)=cova(:,:,q)\geye(dim,dim,'single');
gend
흐릿 해지는 크기를 늘리려고하면 결과가 매우 느립니다. for 루프와 함께 동등 코드를 작성하면
Jacket과 작업하면서이 문제를 발견했습니다. gfor 루프 내에서 컴파일 된 함수 (gcompile로 컴파일 됨)를 사용합니다. 이것은 내가 아는까지 지원하기위한 것입니다 : http://wiki.accelereyes.com/wiki/index.php/GCOMPILE 하지만 난 컴파일되지 않은 함수가 정확한 결과를 제공하면서, 컴파일 된 함수가 모든 g
매트릭스에서 가능한 한 빨리 임계 값을 사용한 후에 0이 아닌 요소를 찾고 싶습니다. 염두에두고 CUDA \ 재킷을 가지고, 나는 그것이 출력의 크기가 찾기 기능 이전에 알려지지 않았기 때문에 이것은 아마도 메모리 할당 문제로 인해 matlab의 "보통"CPU 버전보다 훨씬 느리다는 것을 알게되었습니다. 그러나 'bwlabel'및 'regionprops'(
나는 K 최대 고유치를 계산할 필요가있는 스펙트럼 클러스터링을위한 병렬 알고리즘을 연구 중이다. Matlab을위한 Jacket 플러그인을 사용하고 있지만, 슬프게도 matlab에서 EIGS 함수를 지원하지 않는다. (K를 계산할 수 없다. 고유 값을 평행하게) GPU에서이 작업을 수행 할 수있는 다른 도구/라이브러리를 제안 해 주시겠습니까? 아니면 GPL