2017-09-30 4 views
0

scikit-learn 문서를 자세히 읽은 후 더미 classif9er에 맞추려고합니다. 그러나, 실행시 값 오류가 발생합니다. 이전에 동일한 데이터 (예 : X = vector_data (희소 행렬)) 및 y = vector_target (int 목록)과 같은 오류가없는 그리드 검색 cv를 사용하여 예기치 않게 발생했습니다.Sklearn train_test_split가 1d 배열을 만듭니다

따라서 train_test_split을 소개해야합니다.

왜 내 코드에서 문서와 대조적으로 어떤 예방 조치를 취해야합니까?

X_train, X_test, y_train, y_test = train_test_split(vector_data, vector_target, random_state=0) 
clf = DummyClassifier(strategy='stratified',random_state=0) 
clf.fit(X_train, y_train) 
clf.score(X_test,y_test) 

DeprecationWarning: Passing 1d arrays as data is deprecated in 0.17 and will raise ValueError in 0.19. 
Reshape your data either using X.reshape(-1, 1) if your data has a single feature or X.reshape(1, -1) if it contains a single sample. 
     DeprecationWarning) 
+0

'vector_data.shape','X_train.shape' 및'X_test.shape'은 무엇입니까? – Psidom

답변

0

항상 경고/오류 메시지를 읽으십시오. 다만이 간단한 코드를 이해하려고

X_train, X_test, y_train, y_test = train_test_split(vector_data.reshape(-1, 1), 
      vector_target, random_state=0) 

내가 더 말할 수 없습니다

그래서, 이런 식으로 뭔가를하려고합니다.