2014-12-09 7 views
0

저는 K-Means 알고리즘을 사용하여 클러스터를 만듭니다. 아시다시피 K- 평균 알고리즘은 매개 변수로 클러스터 수를 필요로합니다. 클러스터 수를 8에서 2로 시작하고 모든 루핑에서 클러스터의 모든 C- 인덱스를 계산 한 다음이 C- 인덱스를 사용합니다. 그런 다음 C- 인덱스 사전을 비교하고 최소 C- 인덱스 평균을 최상의 클러스터 카운트로 선택하십시오. 클러스터 수를 감지하는 진정한 방법입니까?클러스터를 C- 인덱스 평균과 비교할 수 있습니까?

답변

1

클러스터 수를 정확하게 감지하는 방법은 없습니다. 뒤에 오는 것 google search를보십시오, 이것은 아직도 활동적인 연구 지역이다.

K의 올바른 선택이 해석은 데이터 세트의 점의 분포와 사용자의 원하는 클러스터링 해상도의 형태와 규모에 따라 함께, 종종 모호 : Wikipedia 기사는 말한다.

이 방법으로 c-index를 사용하면 도메인의 클러스터 번호를 확인하는 좋은 방법인지 판단 할 수 있습니다. c-index in clustering을 사용하는 또 다른 질문을보십시오.