2017-11-04 11 views
-1

내가있어 오류 내 데이터 범주 및 연속 변수를 모두 가지고 있으므로, I는 차이도 매트릭스를 사용하여 거리를 설정 NbClust()와 비 유사 행렬을 사용할 때 오류를 수정하는 방법은 무엇입니까? 내 데이터 (K)의 최적의 수를 찾기 위해 코드 노호 사용시

res.nb <- NbClust(diss=gower_dist_gender,distance=NULL, min.nc = 1, 
       max.nc = 30,method = "complete", index ="all") 

NULL로. 이 오류를 어떻게 해결할 수 있습니까? 문제가 무엇입니까?

오류 : NbClust에서 오류 (데이터 = NULL, DISS = gower_dist_gender 거리 = NULL은 :. 데이터 매트릭스는 필요한 경우에만 프레이 맥클레인, CINDEX, sihouette입니다 던이 계산 될 수

I. 사전에 여러분 모두 감사합니다.

+0

'gower_dist_gender'는 어떻게 계산 되었습니까? – G5W

+0

gower_dist_gender <- daisy (mydata, metric = "gower") – far

답변

0

수치 데이터가 필요 인덱스의 일부를.

따라서이 기능은 데이터 세트에 사용할 수 없습니다 하지 않는 한 ONL 선택 y 좌표는 좌표가 필요하지 않습니다..

데이터 매트릭스가 필요하다 :

오류 메시지를 인용합니다. frey, mcclain, cindex, sihouette 및 dunn 만 계산할 수 있습니다.

이러한 색인 만 거리 매트릭스에서 작동합니다. 다른 모든 인덱스는 숫자 좌표를 필요로합니다.

+0

: 데이터가 혼합되어 있기 때문에 이러한 조건을 만족시키기 위해 차이 매트릭스를 사용했습니다. (숫자 데이터가 필요할 때마다 나는 비 유사 매트릭스를 사용했습니다. 그것은 작동하지 않는 것 같습니다. 왜 비평 행렬이 이러한 부족분을 보상 할 수 없습니까? – far

+0

: 오류 (frey, mcclain, cindex 및 dunn)에서 언급 한 색인이 작동하지 않습니다. 난 그냥 실루엣을 사용할 수 있습니다.이 인덱스는 잘 작동하지만, 데이터의 클러스터 수를 확인하기 위해 더 많은 인덱스 결과가 필요합니다. – far

+0

frey, mcclain, dunn, cindex를 포함한 오류에서 언급 된 메서드는 다음 오류 코드에서 사용되었습니다. rep (NA, nn)의 오류 : 'times'인수가 올바르지 않습니다. silhoutte 메서드가 제대로 작동합니다. 어떤 도움이나 지침에 감사드립니다. – far