2017-12-29 27 views
-1

5 개의 클러스터로 데이터를 분할하려고합니다. 하지만 다음과 같은 오류가 발생했습니다storage.mode (x) <- "double": kmeans에서 강요에 의해 도입 된 NAD가

> colSums(sapply(train1,is.na)) 
    train_id    name item_condition_id  category_name 
      0     0     0     0 
    brand_name    price   shipping item_description 
      0     0     0     0 
> train1matrix=as.matrix(train1) 
> train1vector=as.vector(train1matrix) 
> k=5 
> set.seed(88) 
> KMC=kmeans(train1vector,centers=k,iter.max=1000) 
Error in do_one(nmeth) : NA/NaN/Inf in foreign function call (arg 1) 
In addition: Warning message: 
In storage.mode(x) <- "double" : NAs introduced by coercion 

나를 도와 줄 수있는 사람이 있습니까? 그것은 을 의미 계산해야하기 때문에 사전에 는 숫자 열을 사용할 수 있습니다

+0

'train1'에서 데이터를 공유하려면'fput '을 사용하십시오. – MKR

+0

고맙습니다 ...하지만 아직 시도하고 있습니다. 이전 데이터 프레임에서 새 데이터 프레임으로 데이터를 복사하려면 fput을 사용하는 것이 좋습니다. –

+0

당신은'dput (train1)'또는 적어도'dput (train1 [1:20,])'의 출력을 공유해야합니다. –

답변

0

kmeans을 주셔서 감사합니다.

평균을 계산하는 것이 의미가없는 "ID"열, 텍스트 열 등에는 사용하지 마십시오. 너가 그런 '나쁜'칼럼에서 kmeans를 실행하려고 시도하는 것 같습니다.