2016-11-16 10 views
1

R의 cor()을 사용하여 상관 관계를 찾는 동안 대각선 항목을 제외한 모든 NA 값을 얻었습니다. NAs를 쌍으로 제거했습니다. NAs를 명시 적으로 제거하면 원하는 결과를 얻을 수 있습니다. 나는 그 주장을 오해 했습니까? 예상되는 상관 관계 값을 얻지 못했습니다 - R cor()

나는
> c <- Result_table[,.SD,.SDcols=c("organic_account_countsession", "organic_account_countsession")] 
> b <- cor(c, use="pairwise.complete.obs") 

          organic_account_countsession organic_account_countsession 
organic_account_countsession       1       NA 
organic_account_countsession       NA       1 

는 또한 여전히이

> b <- cor(c, na.rm=TRUE) 

을 시도 같은 결과를 얻었다 시도했다.

내가

c <- c[complete.cases(c)] 
b <- cor(c) 

          organic_account_countsession organic_account_countsession 
organic_account_countsession       1       1 
organic_account_countsession       1       1 

을 할 때에 만 나는 모두 1을 얻는다. 변수가 자신과 상관 관계를 맺고 있기 때문에 1을 모두 얻길 기대합니다.

(참고 : 변수 분산을 가지고, NA는 더 차이로 인해되지 않습니다)

답변

1

이 내 부분에 전혀 다른 오류로 밝혀졌다.

패키지 과 함께 h2o 패키지를 가져 왔습니다. h2ocor() 기능이 있으며 다른 동작을합니다.

cor <- stats::cor 

이 문제를 해결했습니다.