2016-06-21 15 views
-2

DBSCAN 및 OPTICS를 사용하여 위치 클러스터링을 수행하기 위해 ELKI를 사용하고 있습니다. 내 데이터 세트에는 30 명의 참가자가 포함되어 있지만 표시가되어 있지 않지만 각 참가자의 빈번한 장소로 좌표 (예 : 집, 직장 등)가 있습니다.클러스터 외부 유효성 확인

이 좌표 쌍이 각 클러스터에 속해 있다는 것을 알고 싶습니다. 한 가지 방법은 최소 거리 임계 값을 사용하여 클러스터의 각 쌍을 수동으로 확인하는 것입니다.

이것을 달성하는 더 좋은 방법은 무엇일까요?

+0

귀하의 목적을 이해하지 못합니다. –

+0

사실 나는 지상 진실에 대해 클러스터를 검증하고 싶습니다. – user1124825

+0

데이터에는 레이블이 지정되어 있지 않지만 사람들의 잦은 위치를 알고 있습니다. 평균적으로 각 사람마다 4 ~ 6 개의 다른 위치가 있습니다. – user1124825

답변

1

당신이로 입력 데이터를 포맷 할 수 있습니다 :

123 456 work1 
124 457 work1 
789 123 home2 
123 123 unknown 

레이블은 숫자가 아닌 있어야한다, 내가이 예를 들어 "근무처", "근무처"등을 선택 그 이유는.

그러면 ELKI가 자동으로 결과를 평가할 수 있습니다.