k- 평균 알고리즘을 사용하여 문서 집합을 클러스터링합니다.8 클러스터가있을 때 샘플의 90 %가 하나의 클러스터에 속하는 이유는 무엇입니까?
(파라미터는 - 클러스터 = 8, 서로 다른 무게 중심에 대한 실행 횟수 = 10의 수) 문서 번호 5800
있다
놀랍게도 클러스터링 결과
90 % (최종 클러스터) 9 %의 문서가 클러스터 0 (첫 번째 클러스터)에 속합니다.
나머지 6 개 클러스터에는 하나의 샘플 만 있습니다. 이것에 대한 이유는 무엇일까요?
이 http://stats.stackexchange.com에 물어 잘못 .. 필요한이 시나리오의 원인이 가능한 "버그"를 많이 없습니다 - 그리고 그들은 더 많은 정보가 필요합니다. – Paul