2017-12-25 24 views
-1

1에 합하지 않은 레이블을 전달할 수있는 내장형 텐서 플로를 찾을 수 없으므로 직접 작성하려고 시도했습니다 (입력은 [배치 크기, 레이블] 임)weighted cross-entropy tensorflow

tf.reduce_mean(tf.reduce_sum(y_true,axis=1) * tf.reduce_logsumexp(y_pred_logits,axis=1) 
- tf.reduce_sum(y_true * y_pred_logits,axis=1)) 

그러나 작동하지 않는 것 같습니다 (손실이 분산 됨). 내가 뭐 잘못 했어요?

답변

0

나는 그것이 정확하다고 생각하지만, 나는 Adam optimizer의 "epsilon"을 너무 낮게 설정했다.