답변

5

초기화는 무작위로 가정되므로 초기화와 관계없이 클러스터링이 동일한 결과로 수렴됩니까?

확실히 반대로. k -가 문제가 좋은 convex 최적화 문제라면, 간단히 (0,0, ..., 0)으로 시작하면 올바른 답을 줄 수 있으므로 무작위로 초기화하지 않을 것입니다.

무작위 초기화의 이유는 다른 랜덤 씨앗을 시도하여 다른 해결책을 얻을 수 있다는 것입니다. 그런 다음 k- 실행이 완료되면 가장 좋은 것을 선택하십시오. 많은 응용 프로그램에서 10 회의 실행이 좋은 경험 법칙입니다.

k의 전역 최소값을 찾는 것은 일반적으로 NP-hard입니다. 일반적인 알고리즘은 실제로 경험적입니다.

2

사실 k- 평균 알고리즘의 초기화는 얻은 결과에 명확한 영향을 미칩니다. '나쁜'초기화를 방지하기 위해이 문제를 극복하는 k-means ++ 알고리즘에 의지 할 수 있습니다. 위키 백과 (http://en.wikipedia.org/wiki/K-means%2B%2B)에서 확인할 수 있습니다.