2017-12-29 20 views

답변

0

그래디언트 스텝 크기가 작을수록 모델을 학습하는 데 필요한 반복 횟수가 늘어납니다. 이렇게하면 교육 시간이 늘어나지 만 손실 기능의 평균 오류를보다 정확하게 최소화하는 데 도움이됩니다. Read the official recomendations for tunning you CBR model

+0

이 매개 변수는 예를 들어 선형 DURING 교육과 같이 변경해야합니다. 첫 번째 반복의 경우 0.03이며, 각 반복에서 0.001 단계를 줄임으로써 0.003으로 감소합니다. –