2017-09-26 3 views
0

ValueError가 발생합니다. 오류를 푸는 데 너무 많은 값이 있습니다. 여기에 코드 샘플이 있습니다NaiveBayesClassifier를 CSV 데이터 세트로 교육하는 중 오류가 발생합니다.

import numpy as np 
import pandas as pd 
from textblob.classifiers import NaiveBayesClassifier 

sms_raw = pd.read_csv('text.csv') 
# training dataset 70% 
# test dataset 30 % 
sms_raw['split'] = np.random.randn(sms_raw.shape[0], 1) 
fltr = np.random.rand(len(sms_raw)) <= 0.7 
train = sms_raw[fltr] 
test = sms_raw[~fltr] 
cl = NaiveBayesClassifier(sms_raw) 
+0

text.csv에서 데이터의 특성 또는 샘플에 대한 설명의 일종이다 필요 – sgDysregulation

+0

csv 파일에는 두 개의 열이 있습니다. 하나는 문자 메시지를 포함하고 다른 하나는 범주를 포함합니다. –

답변

0

NaiveBayesClassifier는 팬더 데이터 프레임을 입력으로 사용할 수 없습니다. 또한, 마지막 줄에 당신이 입력으로 sms_raw 데이터를 복용하고 난 당신이 의미 같은데요 :

cl = NaiveBayesClassifier(train) 

직접 CSV 파일에서 읽거나 목록에 팬더 dataframes을 변환해야합니다.

에 한번 직접이 예에서 보는 CSV에서 읽으려면

train.to_dict(orient='records') 
cl = NaiveBayesClassifier(train) 

를 사용하여 : 이 https://github.com/sloria/TextBlob/issues/142