효율적인 결과를 위해 DBSCAN 알고리즘에 eps 및 minPts 매개 변수를 제공하기 위해 사용해야하는 루틴 또는 알고리즘은 무엇입니까?효율적인 결과를 얻으려면 eps와 minPts (DBSCAN 알고리즘의 두 매개 변수)를 어떻게 선택할 수 있습니까?
-1
A
답변
0
DBSCAN 논문은 차원에 따라 minPts를 선택하고 k 거리 그래프의 팔꿈치를 기반으로 eps를 제안합니다. 보다 최근 공보
슈베르트, E., 샌더, J., 에스테르, M., Kriegel, H. P., & 쑤 X. (2017).
DBSCAN Revisited, Revisited : DBSCAN을 사용해야하는 이유와 방법 (계속) 데이터베이스 시스템에
ACM 거래 (TODS), 저자가 크고 시끄러운 데이터 세트에 대한 더 큰 minpts를 사용하여, 당신은 너무 큰 클러스터를 얻을 수 있는지 여부에 따라 엡실론을 조정하는 것이 좋습니다 19
42 (3), (엡실론 감소) 또는 너무 많은 소음 (엡실론 증가). 클러스터링에는 반복이 필요합니다.
당신의 데이터를 보지 않으면 무엇이 잘못 될 수 있는지를 보여주기 때문에 그 종이는 재미있는 읽을 거리였습니다. 사람들은 실적 통계에 너무 집착하고 실제 데이터를 보지 않아야합니다.
"효율적인" –