2017-09-13 11 views

답변

1

표준 k- 수단은 하드 클러스터링 알고리즘이며, 즉 적합한 정도는 없다. 데이터 포인트는 단 하나의 클러스터에 속합니다. 다음은 관련 academic paper (강조가 추가됨)의 견적입니다.

2.3.1. 하드 K-수단

[...]

오브젝트의 이가 멤버십도 클러스터링 K-수단 I K 클러스터 에

허용된다 ∈ {[내가 K] λ 0,1}. 객체 I가 클러스터 의 멤버 인 경우 그

K-means++가 K-수단의 초기 값 (시드)을 선택하기위한 단순한 알고리즘 다른 클러스터의 멤버 일 수 있으며 없다 하드 클러스터링 알고리즘으로서 k-means의 근본적인 특성을 변경하지 않습니다.

0

변종의 "소프트"이 있습니다. 특히, 퍼지-C-수단에서

을 (그들이 K 대신 C를 사용하는 이유 ... 저를 요구하지 않습니다)하지만 결과 소프트 할당이 통계적 확률에서 멀리 있음을 조심. 이것은 제곱 된 거리를 기준으로 상대적인 가중치를 부여하는 숫자입니다. 없이 강력한 통계 모델입니다.