2017-05-16 8 views
2

나는 데이터를 분석하기 위해 클러스터링을하고 있습니다. 지금까지 완벽하게 작동합니다.k는 클러스터링 한계를 의미합니까?

library(Ckmeans.1d.dp) 
file=read.csv(file.choose(),header=T) 
attach(file) 
sortfile=file[order(normalized),] 
results=Ckmeans.1d.dp(normalized,3) 
plot(results) 

지금, 내가 클러스터와 센터를 얻을 수 있어요,하지만 난 클러스터의 "한계"를 얻기에 더 관심이 있어요 : 이 지금까지 내 코드입니다. 내가 사용하는 데이터 중에서 한 클러스터의 최대 값이 아니라 현재 가지고있는 클러스터의 한계. 그게 가능하니? 내가 어떻게 해?

답변

1

K- 가장 가까운 중심 (클러스터 중심)을 기준으로 한 점을 의미합니다. 따라서 클러스터 간의 "한계"(결정 경계라고 함)는 가장 가까운 중심선 (예 : 그들과 정확히 같은 거리)으로 적어도 2 개의 다른 중심을 갖는 지점입니다.

예를 들어 2D에서 평면의 각 점에 대해 가장 가까운 중심을 계산합니다. 두 개 이상의 가중치가있는 경우 (예 : 최소 두 개의 중심이 최소 거리에있는 경우) 결정 경계의 일부입니다.