1
Halide :: sum 중첩 된 인쇄 루프는 tutorial으로 작성된 최적 값과 동일하지 않습니다.Halide sum loops 중첩
이 코드는 제로 초기화 및 합계를 위해 별도의 루프를 제공합니다.
Halide::Func f("f");
Halide::Var x("x");
Halide::RDom r(0, 3);
f(x) = Halide::sum(r + x);
f.print_loop_nest();
f.realize(10);
출력 :
produce f:
for x:
produce sum:
for x:
sum(...) = ...
for x:
for r4:
sum(...) = ...
consume sum:
f(...) = ...
이 루프 또는 성능에 영향을주지 않습니다 융합 할 수 있습니까? 감사!
업데이트 :이 같은 퓨즈 :
produce f:
for x:
produce sum:
for x:
sum(...) = ...
for r4:
sum(...) = ...
consume sum:
f(...) = ...
Andrew, 감사합니다! 이제 알았어. –