이것은 다소 일반적인 질문입니다. 역 전파 알고리즘을 구현할 때 "큰"학습 속도에서 시작하여 오류가 증가하기 시작한 후에 감소시킵니다. 좁혀서. 오류가 조금 (StateA) 증가하거나 직전에 (StateB, 이전 "성공"상태로 롤백하는)이 속도 감소를 수행 할 수 있습니다.오차 역 전파 알고리즘의 감소율 학습
그래서 질문은 무엇입니까? 수학적 관점에서 더 낫다. 아니면 두 가지 병렬 테스트를 실행해야합니까? StateA 지점에서 배우고 StateB를 감소 된 학습 속도로 가리키고 어느 것이 더 빠르게 감소하는지 비교해 봅시다.
동의어 마지막 단락에서 접근하지 않았습니다. 이 질문을 쓰는 동안 마음에 드는 것만 나타납니다. 알고리즘의 현재 구현에서 실수로 로컬 최소값에 직면했을 경우 학습 속도의 감소가 전체 최소값으로 이전 방향으로 되돌아 가게한다는 가정하에 학습률이 감소한 StateA에서 계속 학습합니다.