데이터 프레임에서 가중치가있는 유클리드 거리를 갖는 거리 매트릭스를 만들고 싶습니다. 가중치는 벡터에 정의됩니다. library("cluster")
a <- c(1,2,3,4,5)
b <- c(5,4,3,2,1)
c <- c(5,4,1,2,3)
df <- data.frame(a,b,c)
weighting <- c(1, 2, 3)
dm <-
각 관찰에 대해 가장 가까운 클러스터를 찾기 위해 두 데이터 프레임의 행 사이의 거리 (비 유사성)를 계산하고 싶습니다. 요인과 수치 변수가 있으므로 Gower 거리를 사용하고 있습니다. 하나의 행렬의 행 사이의 차이점이 아닌 두 개의 데이터 프레임을 비교하려는 경우 gower.dist가 필요한 함수가됩니다. 그러나 구현할 때 데이지의 거버 (gower)를
나는 범주 적 (명목상과 서수) 및 숫자 속성을 모두 포함하는 데이터 집합이 있습니다. 나는 이러한 혼합 된 속성을 사용하여 내 관측을 가로 지르는 (dis) 유사성 행렬을 계산하려고합니다. 다음과 같이 R의 클러스터 패키지의 daisy() 기능을 사용하여, 나는 쉽게 유사성 행렬을 얻을 수 있습니다 : if(!require("cluster")) { ins
오늘 cluster 패키지의 silhouette 플롯이 RStudio에 올바르게 표시되지 않는다는 것을 깨달았습니다. 구글 검색은 다른 사람이 가진 문제를 가지고 한 것으로 나타났습니다 : http://support.rstudio.org/help/discussions/problems/3094-plotsnot-showing-up-in-r-studio 가 R에
250 종의 행동 특성을 수명 기록 전략으로 클러스터링하려고합니다. 특성 데이터는 수치 변수와 명목 변수로 구성됩니다. 나는 R과 클러스터 분석에 비교적 익숙하지 만,이 점들에 대한 거리를 찾는 최선의 선택은 데이지 기능 내에서 고어 (gower) 유사성 방법을 사용하는 것이라고 믿는다. 1) 그게 최선의 방법인가요? 이러한 거리가되면 중요한 클러스터를 찾
R을 사용하여 CRAN cluster 패키지를 사용하여 k- 메도 이달 클러스터링 분석을 수행했습니다. 데이터는 data.frame이고 df4는 13111obs입니다. 이진수와 서수 값은 11 개입니다. 클러스터링 후 클러스터 결과를 원래 data.frame에 적용하여 해당 클러스터 번호를 사용자 ID에 표시했습니다. 클러스터에 따라 이진 및 서수 선택을
커뮤니티 I 좌표 (x, y, z) 및 24 X 10^6 행과 3 열을 포함하는 대용량 데이터 세트를 을 유클리드 거리 계산을 빠르게하는 방법. 모든 행과 0, 0, 0 인 첫 번째 행 사이의 유클리드 거리를 계산해야합니다. 아래의 루프를 사용하면 매우 오랜 시간이 걸립니다! 또한 데이터 프레임 대신 매트릭스에서도이 작업을 시도했지만 문제가 해결되지 않았습