2017-01-30 7 views
0

xgboost 교차 유효성 검사 실행 곡선 아래 영역을 얻습니다. < 0.5.xgboost.cv는 0.5 미만의 곡선 아래 영역을 반환합니다.

best_params_grid_search={'base_score': 0.5, 
'colsample_bylevel': 1, 
'colsample_bytree': 0.8, 
'gamma': 0, 
'learning_rate': 0.3, 
'max_delta_step': 0, 
'max_depth': 3, 
'min_child_weight': 3, 
'missing': nan, 
'n_estimators': 15, 
'objective': 'binary:logistic', 
'reg_alpha': 0, 
'reg_lambda': 1, 
'scale_pos_weight': 1, 
'seed': 5, 
'silent': 1, 
'subsample': 0.8} 

skf_inner = StratifiedKFold(n_splits=n_fold_inner,random_state=5, shuffle=True) 

dtrain = xgb.DMatrix(X_train, label=y_train, missing = np.nan) 

num_rounds = 20 
cv_xgb4 = xgb.cv(best_params_grid_search, 
dtrain,num_boost_round =num_rounds,folds=skf_inner,metrics={'auc'},seed=5) 

를 수행하지만 내가 AUC < 0.5 얻을로

나는 xgboost.cv을 실행하고 있습니다. 이 결과를 어떻게 해석해야합니까?

test-auc-mean test-auc-std train-auc-mean train-auc-std 
0  0.402675  0.088828  0.777729  0.058559 
1  0.390638  0.124389  0.890424  0.044356 
2  0.418827  0.068236  0.932992  0.031358 
3  0.448971  0.073219  0.946747  0.011304 
4  0.460597  0.118598  0.956311  0.008302 
5  0.437963  0.057661  0.970979  0.005968 
6  0.461831  0.095017  0.978789  0.010346 
7  0.422428  0.111894  0.977095  0.014329 
8  0.419650  0.117329  0.983260  0.011606 
9  0.433745  0.106113  0.989522  0.008979 
10  0.440947  0.097941  0.992227  0.009497 
11  0.449588  0.071629  0.994396  0.006438 
12  0.429218  0.061360  0.995858  0.004400 
13  0.455144  0.064862  0.998051  0.002757 
14  0.443416  0.057515  0.999513  0.000689 
15  0.440535  0.079628  0.999513  0.000689 
16  0.446296  0.077557  1.000000  0.000000 
17  0.450000  0.074674  1.000000  0.000000 
18  0.468107  0.092640  1.000000  0.000000 
19  0.451029  0.096165  1.000000  0.000000 

데이터 여기 downoladed 수 있습니다

https://drive.google.com/file/d/0B3vXKJ_zYaCJQmxWX1AtTjdoYWc/view?usp=sharing

미리 감사드립니다. 그것은 당신의 분류는 가치가없는 분류 (임의 선택) .Proof 다음 악화 작동하는지, 그것이 의미하기 때문에 AUC < (50)을 가지고 unnormal의 모든

답변