DOB, Gender, State, Pincode, Transaction_id, Promocode 등의 속성을 사용하여 특정 데이터 세트에 따라 고객을 그룹화하려합니다.K-means 알고리즘의 시드 값을 넣는 방법은 무엇입니까?
내가 알고리즘을 실행할 때마다 실루엣 점수에 큰 차이가 있습니다. 이전 결과와의 클러스터링, 즉 결과가 일관성이 없습니다. 아마 그것은 데이터 세트에 대한 임의의 시드 때문입니다. 다음은 속성을 알고리즘에 전달하는 선입니다.
km1 = KMeans(n_clusters=6, n_init=25, max_iter = 600)
클러스터를 할당하거나 내가 프로그램을 실행 매번 한 후, 점수가 일관되고 더 나은되도록 최적화 할 수있는 방법이 있습니까?
저는 scikit-learn과 함께 Python 3을 사용하고 있습니다.
여기에 어떤 언어 및 프레임 워크가 사용됩니까? Scikit을 배우는 파이썬인가? 명확히하십시오 (특정 태깅도 작업을 수행 할 수 있습니다) ... – desertnaut