2017-02-11 9 views
1

(오류 ponderation에 대해) 나는 Encog 일부 검사 및 AutoMPGRegression 예를 실험하고 있습니다 :회선 출력 무게 신뢰도가있는 회귀 회귀.

https://github.com/encog/encog-java-examples/blob/master/src/main/java/org/encog/examples/guide/regression/AutoMPGRegression.java

내 질문은 매우 간단 데이터 CSV의 출력에 무게 신뢰성을 설정하는 방법은 무엇입니까 선 ?

실제로 데이터의 일부 샘플은 다른 것보다 더 신뢰할 수 있습니다. 따라서 신뢰할 수없는 라인 데이터의 경우 신경 네트워크가 해당 출력과 일치하지 않으면 Encog에 대해 중요하지 않음을 알려야합니다. AutoMPGRegression 샘플 CSV 데이터

추출물 :

18.0 8 307.0  130.0  3504.  12.0 70 1 "chevrolet chevelle malibu" 

15.0 8 350.0  165.0  3693.  11.5 70 1 "buick skylark 320" 

18.0 8 318.0  150.0  3436.  11.0 70 1 "plymouth satellite" 

내가 라인 (2)에 대해 그 Encog에게 전하고 싶은는 출력 값 "15"는 50 %의 fiability을 가지므로 오차가 ponderated되어야 그 라인을 위해. 도움을

감사합니다, 트릭스

+0

@ Gama11 또는 trix 무엇이 자유입니까? –

+0

@YuraZaletskyy는 fiability/reliability로 말합니다. 주어진 입력에 대해 출력이 적거나 없다는 것을 의미합니다. – trix

답변

0

좋은 질문! 여러분이 묻는 것은 사실 이상 치의 정확한 분류입니다. 즉, 교육 데이터의 일부가 전체 교육 데이터를 잘 나타내지 못하는 경우입니다. 일반적으로 신경망은 예외적 인 두 행이 어떻게 든 특이 치 (Outliers)가된다는 것을 잘 알고 있으므로 도움없이 이해할 수 있습니다. 특이 치의 1 ~ 5 %가있는 경우, 신경망을 사용하면 도움없이 무시할 수 있습니다. 일부 테스트에서 신경망은 10 %의 이상 치를 "무시"할 수있었습니다. 즉, 신경망은 이상 치를 잡음으로 간주 할 것입니다. 실제로 필요한 것은 훈련 세트와 유효성 검증 세트가 이상치와 거의 비슷한 비율을 가지고 있는지 확인하는 것입니다.