250 종의 행동 특성을 수명 기록 전략으로 클러스터링하려고합니다. 특성 데이터는 수치 변수와 명목 변수로 구성됩니다. 나는 R과 클러스터 분석에 비교적 익숙하지 만,이 점들에 대한 거리를 찾는 최선의 선택은 데이지 기능 내에서 고어 (gower) 유사성 방법을 사용하는 것이라고 믿는다. 1) 그게 최선의 방법인가요?데이지 기능과 Gower를 사용하여 최적의 클러스터 수를 결정합니다. 유사성
이러한 거리가되면 중요한 클러스터를 찾고 싶습니다. 나는 pvclust를 들여다 보았고 클러스터의 힘을 나에게 줄 수있는 능력을 좋아한다. 그러나 이전에 데이지를 사용하여 거리 측정을 허용하도록 코드를 수정할 수 없었습니다. 나는 여기에 주어진 조언을 따르려고 애썼다. https://stats.stackexchange.com/questions/10347/making-a-heatmap-with-a-precomputed-distance-matrix-and-data-matrix-in-r/10349#10349 여기에서 얻은 코드를 사용하여 http://www.is.titech.ac.jp/~shimo/prog/pvclust/pvclust_unofficial_090824/pvclust.R
2) 나의 거리 측정을 받아들이 기 위해 기존 코드를 수정할 수있는 사람이 있습니까?
3) 아니면 중요한 클러스터의 수를 결정하는 더 좋은 방법이 있습니까?
귀하의 도움에 미리 감사드립니다.