1

나는 (평균 및 분산으로 표시되는) 다 변수 (2D) 가우시안 분포 집합을 가지고 있으며 확률 적 가우스 정보를 유지하는 방식으로 이러한 분포에 대해 클러스터링을 수행하려고합니다 (아마도 분산의 중첩을 사용합니까?).다 변수 가우스 분포 집합에 대해 클러스터링을 수행하는 방법이 있습니까?

enter image description here

내가 클러스터링 방법으로 몇 가지 조사를 수행하고 내가 찾아 낼 것으로 예상 얼마나 많은 클러스터 모르는로 DBSCAN 클러스터링, K-수단보다 더 적합한 것으로 나타났습니다. 그러나 DBSCAN은 유클리드 거리 엡실론 값을 사용하여 각 분포의 분산을 사용하는 대신 클러스터를 찾습니다. 또한 Gaussian-Mixture Model 방법을 살펴 보았지만 클러스터를 가우시안 분포 집합에 맞추는 대신 K 가우시안 클러스터 집합에 점 집합을 맞 춥니 다.

내 요구에 맞는 추가 클러스터링 방법을 아는 사람이 있습니까?

감사합니다.

답변

1

DBSCAN은 임의의 거리에서 사용할 수 있습니다. 유클리드 거리로 제한된 이 아니라입니다. 차이 측정을 사용할 수 있습니다 (예 : 귀하의 가우시안 의 겹침 정도는입니다.

그러나 계층 적 클러스터링 또는 Gaussian Mixture Modeling (EM)을 제안합니다.

DBSCAN 잘 가우시안 근사 하지이다 바나나 형 클러스터를 허용하도록 설계이다. 귀하의 목표는 비슷한 가우시안을 병합하는 것 같습니다. 이는 계층 적 클러스터링에 의해 더 잘 달성됩니다.

+0

응답 해 주셔서 감사합니다. 계층 적 클러스터링을 사용하는 방법을 자세히 살펴 보겠습니다. – Unl1ght