2017-11-21 7 views
-1

나는 4 개의 데이터 열을 가지고있다. 이 X의 경우 3 개의 클러스터 센터를 무작위로 선택하고 SSE가 가장 적은 클러스터를 찾아야합니다. 센터와 관성 (SSE)이 무작위 상태를 변화시키면서 동일하고, init = 무작위 매개 변수로 둘 다 같아지는 이유는 무엇입니까?K를위한 클러스터 센터 반복 파이썬에서

Xvar=stud.iloc[:,1:5] 

    #X1=np.random.randint(22,99,size=(3,4)) 

    kmeans1= KMeans(n_clusters=3, init='random', random_state=101) 

    kmeans1.fit(Xvar) 

    kmeans1.labels_ 

    kmeans1.cluster_centers_ 

    kmeans1.inertia_ 

답변

0

너무 단순한 데이터에서 많은 다른 초기 시드가 동일한 결과로 수렴합니다. 내가 정확히 기억한다면 n_init

게다가, 그는 기본값은 10입니다, 그래서 그냥 1 열 실행 중이 같은 ...

+0

감사를 얻을 수 있다면, 그게 문제라고 생각. 내 데이터에는 약 70 행만있었습니다. – chanmad