나는 얼굴 이미지에 대한 깊은 학습 (CNN + AEs) 접근법을 연구 중이다.왜 유효성 검사 오류율은 같은 값으로 유지됩니까?
I은 할
얼굴 화상
3 회선 + 최대 풀링 +의
112*112*3
의 입력 층 ReLU충분히 50 % 강하 512 개 뉴런 접속의 2 층 에 10 클래스가 있으므로 초과 입력 및 마지막 출력 레이어에 10 개의 뉴런을 사용하지 마십시오.
또한 소프트 맥스 크로스 엔트로피 및 L2의 평균값을 감소시킨다. 평가
- 60 %
- 20 %를
- 20 % : 교육
문제에 대한 검증을 위해 훈련
나는 3 개 그룹 내 데이터 집합을 분할 몇 epochs 후에 유효성 검사 오류율 고정 값을 유지하고 변경되지 않습니다. 내 프로젝트를 구현하는 데 tensorflow
을 사용했습니다.
저는 CNN과 같은 문제가 없었으므로 처음 생각합니다. 나는 tensorflow 문서를 기반으로하는 코드를 검사 했으므로 문제가 코드와 관련이 있다고 생각하지 않습니다. 아마도 일부 매개 변수를 변경해야하지만 확실하지 않습니다.
그런 문제에 대한 일반적인 해결책에 대해 알고 싶습니다.
업데이트 : 옵티 마이저를 기본 학습 속도 인 Adam으로 변경했습니다. 지금은 유효성 검사 오류가 변경되었지만 대부분 일괄 배치 오류가있는 반면 미니 배치 오류보다 낮습니다.
나는 초기 값으로 0.1의 편향을 사용하거나 사용하지 않은 모델을 테스트했지만 아직 잘 맞지 않습니다.
업데이트 빨리 업데이트 할 문제가 곧 수정되었습니다.
매번 동일한 클래스를 예측합니까? 학습률은 얼마입니까? –
@chris_anderson 저는 매번 똑같은 수업을 듣고 학습율이 0.01이고 점차적으로 줄었습니다. –
유효성 검사 비율은 처음에는 감소하고 특정 에포크에서 멈추거나 첫 번째 반복에서 동일합니까? – Feras