나는 매우 큰 데이터 세트를 가진 Python Sckit Learn Module에서 RandomForestClassifier를 훈련 시켰지만,이 모델을 어떻게 저장하고 다른 사람들이 그것을 최종적으로 적용 할 수 있을지는 의문이다. 감사합니다.Python에서 RandomForest Classifier를 출력하는 방법은 무엇입니까?
11
A
답변
23
권장되는 방법은 joblib
이를 사용하는 것입니다 피클보다 파일 크기가 훨씬 작습니다.
from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl')
#then your colleagues can load it
clf = joblib.load('filename.pk1')
4
Pickle 모듈을 사용하여 RandomForestClassifier
절임을 시도한 다음 디스크에 저장해 보셨습니까? 다음과 같이
import pickle
classifier = RandomForestClassifier(etc)
output = open('classifier.pkl', 'wb')
pickle.dump(classifier, output)
output.close()
는 "다른 사람들이"다음 절인 개체를 다시로드 수 : 여기
는 pickle 문서를 기반으로 예제import pickle
f = open('classifier.pkl', 'rb')
classifier = pickle.load(f)
f.close()
+1
joblib은 선호도가 낮고 (예 : 작은 파일) : http://scikit-learn.org/stable/tutorial/basic/tutorial.html#model-persistence – EdChum
참조 http://scikit-learn.org/stable/tutorial/basic/tutorial.html#model-persistence – EdChum