을위한 최적의 매개 변수를 찾기 위해, 내 코드는 다음과 같습니다GridsearchCV 내가 자작 나무에 대한 최적의 매개 변수를 찾을 gridsearchCV을 사용하고 자작 나무
: 출력이 나에게 오류를 제공하지만RAND_STATE=50 # for reproducibility and consistency
folds=3
k_fold = KFold(n_splits=folds, shuffle=True, random_state=RAND_STATE)
hyperparams = { "branching_factor": [50,100,200,300,400,500,600,700,800,900],
"n_clusters": [5,7,9,11,13,17,21],
"threshold": [0.2,0.3,0.4,0.5,0.6,0.7]}
birch = Birch()
def sil_score(ndata):
labels = ensemble.predict(ndata)
score = silhouette_score(ndata, labels)
return score
sil_scorer = make_scorer(sil_score)
ensemble = GridSearchCV(estimator=birch,param_grid=hyperparams,scoring=sil_scorer,cv=k_fold,verbose=10,n_jobs=-1)
ensemble.fit(x)
print ensemble
best_parameters = ensemble.best_params_
print best_parameters
best_score = ensemble.best_score_
print best_score
sil_score 함수에서 채점하는데 필요한 필수 매개 변수가 이미 언급되었을 때 점수 값이 4 개의 인수를 찾는 이유가 혼란 스럽습니다.