2017-01-21 4 views
0

를 사용하는 동안 코드입니다 :에 ValueError : 알 수없는 레이블 유형 : 여기 cross_validation

import pandas as pd 
import numpy as np 
from sklearn.cross_validation import cross_val_score 
from sklearn.neighbors import KNeighborsClassifier 
data = pd.read_csv('http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv',index_col = 0) 
X = data[['TV','Radio','Newspaper']] 
y = data[['Sales']] 
y = np.asarray(y) 
y = np.ravel(y) 
knn = KNeighborsClassifier(n_neighbors = 5) 
scores = cross_val_score(knn,X,y,cv=10,scoring = 'accuracy') 
print(scores) 

내가

C:\Users\Kunal Desai\Anaconda3\lib\site-packages\sklearn\utils\multiclass.py in check_classification_targets(y) 
171  if y_type not in ['binary', 'multiclass', 'multiclass-multioutput', 
172    'multilabel-indicator', 'multilabel-sequences']: 
--> 173   raise ValueError("Unknown label type: %r" % y) 
174 
175 

ValueError: Unknown label type: 

내가 cross_validation 및 scikit-배우고 새로운 해요 다음과 같은 오류를 받고 있어요

아무도 도와 줄 수 있습니까?

+0

나는 이것과 같은 것을 얻고 있었고 b/c 나의 pd.Series는 객체이고 int가 아니 었습니다 –

답변

0

연속 변수를 예측하려면 분류보다는 회귀가 필요합니다. KNeighborsRegressor 대 KNeighborsClassifier입니다.

+0

KNeighborsRegressor를 사용해 보았습니다.하지만 여전히 동일한 오류가 나타납니다. –

+0

실제로 연속 오류를 말합니다. 지원되지 않습니다. 그것은 당신이 회귀에 대해 아무런 의미가없는 "정확도"라고 말했기 때문입니다. 득점을 설정할 수 없으며 rsquared가 기본값을 사용합니다. – simon

+0

그것은 일했다! !! 고마워, 네가 "연속적으로 지원되지 않는다"는 오류에 대해 옳았다. .. 나는 그것을 체크하지 않았다 ... 나는 득점 = "정확도"를 제거하고 잘 동작했다. 다시 한번 감사합니다 –