2013-06-21 4 views
0

나는 분류 목적으로 sklearn.lda를 사용하고 있으며, 평균 분류 오류를 인쇄하는 스코어 함수에 대해 조금 혼란 스럽습니다. 잭 나이프를 하나 남겨두고 결정합니까? 결과를 어떻게 해석합니까? 많은 문서가없는 유일한 부동 소수점 값입니다. 사전에선형 판별 분석

감사합니다, EL

답변

1

score 방법은 샘플 X과 그들의 진정한 라벨 y 소요 y으로 자신의 예측을 비교합니다. 평균 정확도를 반환하며, 이는 항상 하나의 그림입니다. 예를 들어,

lda = LDA().fit(X, y) 
print(lda.score(X, y)) 

은 고유 한 교육 세트에서 분류 기준의 정확도를 인쇄합니다.

모든 분류 기준은 보통 score 방법을 사용합니다. 일반적으로 (반드시 그런 것은 아니지만) 평균 정확도를 반환합니다. 이 방법은 명시 적으로 scoring 인수를주지 않으면 모델 선택 알고리즘 GridSearchCV에 의해 분류 자의 품질을 결정하는 데 사용됩니다.

+0

신속한 답변을 보내 주셔서 감사합니다. 이제 내 질문은 : 출력 값을 어떻게 해석합니까? 방금 테스트 세트 0.8을 받았습니다. 어쨌든 클래스 이름을 주셔서 감사합니다. –

+2

@EldDude : 테스트 세트의 정확도가 80 %임을 의미합니다. 그게 좋은 일인지 여부는 문제에 달려 있습니다. –

+0

cool. 감사. 하나의 마지막 질문 : 어떤 방법이 판별 함수의 매개 변수를 제공합니까? get_params는 나에게 이것을 준다 : { 'priors': None, 'n_components': None} –