TensorFlow를 사용하여 개체 인식을 구현하고 있습니다. 나는이 튜토리얼을 따라했지만 내 자신의 데이터 세트를 사용한다. https://www.tensorflow.org/versions/r0.8/tutorials/mnist/pros/index.html#deep-mnist-for-experts왜 테스트 정밀도가 훈련 정밀도보다 높음
훈련하기 위해 212 개의 양성 샘플과 120 개의 음성 샘플을 사용했습니다. 시험 세트는 100 개의 양성 샘플과 20 개의 음성 시료를 포함합니다. 훈련 정밀도는 32.15 %이지만 시험 정밀도는 83.19 %입니다.
시험 정밀도가 훈련 정밀도보다 높은 이유는 무엇입니까? 내 데이터 세트가 충분하지 않습니까? 데이터에는 통계적 의미가 없습니다. 또는 그것은 훈련의 정확성이 말이되지 않는다고 말하는 사람들을 보았 기 때문에 일반적입니다. 그런데 왜 그런가요?
설명에 따르면 pos/neg 예제의 비율의 차이는 분명히 그러한 관찰을 유발할 수있는 무언가입니다 (비율은 64 %, 비율은 83 %로 테스트). 트레이닝 중에 샘플 중량/클래스 중량을 사용하고 있습니까 (불균형 데이터 작업 기술)? – sascha
No.. 나는 그 기술을 사용하지 않았다. 내 비율을 동일하게 변경했습니다 (교육에서 212 포지션, 80 네거티브 테스트 중 : 100 포지션, 40 네거티브). 훈련 정밀도는 0.27, 시험 정밀도는 0.71 ... 내 부정적인 샘플을 훈련과 테스트 모두에서 양성 샘플 수의 두 배가되도록 확대해야합니까? –