2014-07-16 9 views
0

나는 다음 코드 한 :scikit의 교차 유효성 검사는 어떻게 작동합니까?

print '\nfitting' 
rfr = RandomForestRegressor(
    n_estimators=10, 
    max_features='auto', 
    criterion='mse', 
    max_depth=None, 
) 
rfr.fit(X_train, y_train) 


# scores 
scores = cross_val_score(
    estimator=rfr, 
    X=X_test, 
    y=y_test, 
    verbose=1, 
    cv=10, 
    n_jobs=4, 
) 
print("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(), scores.std() * 2)) 

1)는 cross_val_score는 회귀에 대한 훈련을 실행 하는가?

2) 훈련 된 회귀 분석기 또는 새로운 회귀 분석기를 전달해야합니까? 예 : estimator=RandomForestRegressor(). 어떻게하면 회귀 분석기의 정확성을 테스트 할 수 있습니까? 즉, scikit에서 다른 함수를 사용해야합니까?

3) 정확도는 약 2 %입니다. 그것은 MSE 점수이며, 낮은 점수가 더 좋거나 실제 정확도입니다. 실제 정확도라면 회귀 변수가 범위에서 정확하게 예측하는 방법을 이해하지 못하기 때문에 설명 할 수 있습니까?

그것은

답변

0
  1. 추정기 사실 K 시간을 다시-열차.
  2. 비 숙련 (또는 훈련을 받았지만 모델이 삭제되어 시간 낭비).
  3. R² score입니다. 실제로는 2 %는 아니지만 0.02입니다. R2는 1로 제한되지만 음수 일 수 있습니다. 정확성은 회귀에 대해 잘 정의되어 있지 않습니다. (분류로 정의 할 수 있지만 의미가 없습니다.)