2014-07-24 1 views
3

k를 쓰려고하는데, 위치를 저장하고 두 개의 클러스터 클러스터를 반환하는 double [] []을 사용하는 알고리즘을 의미합니다.k에서 클러스터 값을 선택하는 것은 알고리즘을 의미합니다.

나는 단지 빠른 질문을 가지고 있습니다 : 초기 클러스터 값을 선택하는 가장 좋은 방법은 무엇입니까?

값을 무작위로 시도했지만 항상 정상적인 것은 아니며 온라인에서이 질문에 대한 답변을 찾을 수 없습니다. 어떤 도움이라도 대단히 감사합니다.

+0

절대적으로 표준 k- 평균 알고리즘을 사용해야하는 경우가 아니면 k- 고조파 평균 알고리즘을 검색 할 수 있습니다. 그것은 초기 클러스터 센터의 선택에 훨씬 덜 민감하게 여겨지는 다른 성능 기능을 사용합니다. – Michael

답변

3

일반적으로 무작위 선택보다 효과적 인 일반적인 전략 중 하나는 무작위로 첫 번째 값을 선택한 다음 첫 번째 선택에서 가장 먼 데이터 포인트를 찾아 두 번째 값을 선택하는 것입니다.

다음 값은 처음 두 값과 가장 멀리 떨어져있는 값으로 선택됩니다.

이것은 약간 더 복잡한 초기화 알고리즘 K-means++과 유사합니다.