2017-10-17 17 views
0

저는 x의 값을 sin (x)에 대한 21 개의 가능한 추정치로 분류하는 신경망을 처음부터 구축하고 있습니다. 내 손실 기능으로 MSE를 사용할 계획입니다.예상되는 네트워크 출력에 따라 달라지는 C (가중치) 함수, 가중치와 관련하여 C가 어떻게 차별화됩니까?

MSE of each minibatch = ||y(x) - a||^2, where y(x) is the vector of network outputs for x- 
values in the minibatch. a is the vector of expected outputs that correspond to each x. 

손실을 찾으면 네트워크의 모든 가중치의 열 벡터가 다시 계산됩니다. 델타 w의 열 벡터 - = 각 가중치에 대한 C의 편도 미분의 열 벡터.

문제는 C의 그래디언트를 찾으려면 각 가중치와 구별해야한다는 것입니다. 무엇 처럼 보이는 기능을합니까? 이전에 언급 된 MSE 권한 만이 아닙니다.

도움을 주시면 감사하겠습니다. 또한이 질문을 잘못 놓으면 사전에 사과해야합니다. 여기 또는 수학 포럼에 속한 것인지 확실하지 않았습니다.

감사합니다.

(내가이 온라인에 대한 답을 찾기 위해 노력 것을 추가 할 수 있지만 몇 가지 예 중 하나가 더러운 일을하거나 명확하게 정보를 제공하는 라이브러리를 사용하지 않는 것이 존재한다.)

+0

불행히도이 질문은 프로그래밍 문제가 아니기 때문에 수학이므로 SO에 대한 주제는 아닙니다. –

답변

0

http://neuralnetworksanddeeplearning.com/chap2.html

나는 이것을 얼마 전에 발견했지만, 이제는 그것이 중요하다는 것을 깨달았습니다. 링크는 가중치와 관련하여 C의 부분 도함수에 도달하기 위해 중간 값으로 δ (j, l)를 설명합니다. 위의 링크가 내 질문에 대한 답변 인 경우 여기에 전체 답변을 게시합니다. 아직 답을 얻지 못한 몇 가지 게시물을 보았습니다.