셀룰러 통신 업체에 따라 일부 값을 결정하려고합니다. 나는 모든 통신사에서 데이터를 포함하는 주요 데이터 프레임을 가지고 있고, 나는 공급자가 주요 데이터 프레임에서 3 개 개별 데이터 프레임을 만들었습니다R : 숫자 변수에 대한 평균값이 아닙니다.
나는 변수 중 하나의 평균을 얻고 싶은verizondf <- maindata[maindata$network == "Verizon",]
attdf <- maindata[maindata$network=="ATT",]
tmobiledf <- maindata[maindata$network=="TMobile",]
, "다운로드 ", 숫자 값입니다.
verizondf 데이터 프레임에, 그것은 잘 작동 : 데이터 유형이 어느 시점에서 변경했다면 내가 궁금
> mean(attdf$download)
[1] NA
:하지만, 다른 2의
> mean(verizondf$download)
[1] 462004.4
, 나는 NA 얻을 확인했는데 여전히 숫자입니다 :
> str(attdf$download)
num [1:5516] 321585 50722 400085 287968 138301 ...
이 문제의 원인은 무엇입니까?
데이터에 NA 값이 있습니까? –
평균 '(attdf $ download, na.rm = T)' – Wen
mean (attdf $ download, na.rm = TRUE)을 추가하면'na.rm = –