2016-07-20 1 views
0

향후 5 일 동안 가격을 예측하고 있습니다. 나는 this 자습서를 따라 갔다. 이 튜토리얼은 범주 형 변수를 예측하기위한 것으로 RandomForest Classifier를 사용합니다. 나는이 튜토리얼에서 정의 된 것과 같은 접근법을 사용하고 있지만 RandomForest Regressor를 사용하여 향후 5 일간의 최종 가격을 예측해야한다. 나는 어떻게 예측 않는 것이 혼란 스러워요 여기 RandomForest Regressor : 성능 예측 및 확인

내 코드입니다 : 내 첫 번째 질문은 어떻게 예측 및 두 번째 질문에 대한 5 개 값을 얻기 위해 지정하는 점입니다
import pandas as pd 
import numpy as np 
from sklearn.ensemble import RandomForestRegressor 
from sklearn.ensemble import GradientBoostingRegressor 
from sklearn.metrics.ranking import roc_curve, auc, roc_auc_score 

priceTrainData = pd.read_csv('trainPriceData.csv') 

#read test data set 
priceTestData = pd.read_csv('testPriceData.csv') 
priceTrainData['Type'] = 'Train' 
priceTestData['Type'] = 'Test' 


    target_col = "last" 


    features = ['low', 'high', 'open', 'last', 'annualized_volatility', 'weekly_return', 
       'daily_average_volume_10',# try to use log in 10, 30, 
       'daily_average_volume_30', 'market_cap'] 

priceTrainData['is_train'] = np.random.uniform(0, 1, len(priceTrainData)) <= .75 
    Train, Validate = priceTrainData[priceTrainData['is_train']==True], priceTrainData[priceTrainData['is_train']==False] 

    x_train = Train[list(features)].values 
    y_train = Train[target_col].values 
    x_validate = Validate[list(features)].values 
    y_validate = Validate[target_col].values 
    x_test = priceTestData[list(features)].values 



    random.seed(100) 

    rf = RandomForestRegressor(n_estimators = 1000) 
    rf.fit(x_train, y_train) 
    status = rf.predict(x_validate) 

가 어떻게 성능을 확인 않는다는 것입니다

RandomForest Regressor의? 친절하게 도와주세요.

답변

1

x_validate는 사실 'pandas.core.series.Series'입니다. 그래서 이것을 실행할 수 있습니다 : x_validate [0 : 5]

이렇게하면 R 제곱 값을 계산하여 두 번째 질문을 해결할 수 있습니다. rf.score (x_train, y_train)