-1

동안 :오류 : 9 TfidfCountvectorizer와 피팅 다항 나이브 베이 즈 분류하는 동안, 나는이 살해 얻고 피팅 sklearn.naive_bayes.MultinomialNB()

def classify(vector, df): 
    clf = MultinomialNB() 
    model = clf.fit(vector, df.iloc[0:, 1].values) 

if __name__ == "__main__": 
    train, test = gen_train_test(pd.read_csv('Data/datalabel.csv')) 
    vector = joblib.load('Data/tf.pkl') 
    classify(vector, train, name='mnb') 
    print('Program executed!') 

여기에 9 오류가 기차는 크기 409메가바이트의, 그리고 벡터 크기는 20.3GB입니다.

MacBook Pro-13 2017, 8GB RAM, 256GB SSD를 사용하고 있습니다. 코드에서이 간단한 수정 문제는 벡터`8기가바이트 RAM`로 크기 20.3GB`이다`로드 관리 않았다 어떻게

vector = joblib.load(open('Data/tf.pkl', 'rb')) 
+1

를 해결 – MaxU

+0

스택 추적에 오류가 있습니까? 이 스크립트는 어떻게 부르니? 터미널에서 IDE로? –

+0

MaxU- pickle 대신 vectorlib를 덤프하고로드하기 위해 joblib 패키지를 사용했습니다. Joblib은 데이터를 압축합니다. – partoftheorigin

답변