1
나는 나의 일상 기후 데이터 간의 실행() 상관 관계를 할 노력하고있어, 그리고 문제는 내가 내 data.frame 많은 누락 된 값 (NA)를 가지고있다. 나는 p.values 을 얻을 필요가 있기 때문에 cor.test()을 사용하고 있습니다. 예를 들어, 나는 강수량이나 습도 값이없는 어떤 날에는 온도 데이터와 상관 관계를 계산하는 방법을 알고 싶지만 NA 값은 생략하고 싶습니다. 여기NA 값이 R 인 data.frame에서 실행중인 cor.test()를 계산하는 방법은 무엇입니까?
NA 값을 갖는 예 :
library(gtools)
df <- data.frame(temp=rnorm(100, 10:30), prec=rnorm(100, 1:300), humi=rnorm(100, 1:100))
df$prec[c(1:10, 25:30, 95:100)] <-NA
df$humi[c(15:19, 20:25, 80:90)] <-NA
corPREC <- t(running(df$temp, df$prec, fun = cor.test, width=10, by=10))
corHUMI <- t(running(df$temp, df$humi, fun = cor.test, width=10, by=10))
는 전체 데이터 집합을 덮어 심각한 조금, 당신은 생각하지 않는다 될 수 있을까요? –
@BondedDust 확인 감사, –
감사 @Luca Braglia 편집하지만 아이디어는 NA 행을 제거하지 않는 것입니다 (내가 :) 조금 너무 가혹한하고있어 일부 일), 그것은 NA 값을 무시합니다. 예를 들어 합계 ('fun = sum')를 사용하여 동일한 실행 함수를 계산할 때처럼 결과는 계산할 수없는 기간에 NA 값을 제공합니다. 문제는 데이터가없는 한 변수에서만 그 요일을 제거 할 수 없다는 것입니다. –