나는 MNIST 데이터 세트를 해킹하기 위해 숨겨진 계층이 아닌 신경망을 구현하려고 시도했다.Backpropagation 알고리즘 구현의 문제점은 무엇입니까?
저는 Sigmoid를 활성화 함수로 사용하고 교차 엔트로피를 손실 함수로 사용했습니다.
내 네트워크에는 숨겨진 레이어가없고 입출력 만 있습니다.
이 코드는 backpropagation 알고리즘을 구현 한 부분이지만 예상대로 작동하지 않습니다. 손실 함수의 강하는 극도로 느립니다 (0.001에서 1로 학습 속도로 시도했습니다). 정확도는 0.1 이상으로 증가하지 않습니다.
결과는 다음과 같다 :
내가 여기서 무엇을보고에서# 0 loss: 279788.368245 acc: 0.0903333333333
# 1 loss: 279788.355211 acc: 0.09035
# 2 loss: 279788.350629 acc: 0.09035
# 3 loss: 279788.348228 acc: 0.09035
# 4 loss: 279788.346736 acc: 0.09035
# 5 loss: 279788.345715 acc: 0.09035
# 6 loss: 279788.344969 acc: 0.09035
# 7 loss: 279788.3444 acc: 0.09035
# 8 loss: 279788.343951 acc: 0.09035
# 9 loss: 279788.343587 acc: 0.09035
# 10 loss: 279788.343286 acc: 0.09035
# 11 loss: 279788.343033 acc: 0.09035