2017-09-20 7 views
0

셀룰러 통신 업체에 따라 일부 값을 결정하려고합니다. 나는 모든 통신사에서 데이터를 포함하는 주요 데이터 프레임을 가지고 있고, 나는 공급자가 주요 데이터 프레임에서 3 개 개별 데이터 프레임을 만들었습니다R : 숫자 변수에 대한 평균값이 아닙니다.

나는 변수 중 하나의 평균을 얻고 싶은
verizondf <- maindata[maindata$network == "Verizon",] 
attdf <- maindata[maindata$network=="ATT",] 
tmobiledf <- maindata[maindata$network=="TMobile",] 

, "다운로드 ", 숫자 값입니다.

verizondf 데이터 프레임에

, 그것은 잘 작동 : 데이터 유형이 어느 시점에서 변경했다면 내가 궁금

> mean(attdf$download) 
[1] NA 

:하지만, 다른 2의

> mean(verizondf$download) 
[1] 462004.4 

, 나는 NA 얻을 확인했는데 여전히 숫자입니다 :

> str(attdf$download) 
num [1:5516] 321585 50722 400085 287968 138301 ... 

이 문제의 원인은 무엇입니까?

+2

데이터에 NA 값이 있습니까? –

+2

평균 '(attdf $ download, na.rm = T)' – Wen

+1

mean (attdf $ download, na.rm = TRUE)을 추가하면'na.rm = –

답변

1

다른 사람들은 자신의 의견을 지적하면서, 나는 여기서 "더 완전한"설명을 할 수 있습니다.

당신은이 정보를 포함하여 설명을 얻을 것이다 ?mean를 사용하여 도움말 설명서 페이지를 볼 때 (... X)

사용

평균

## 기본값 S3에있어서 평균

은 "인자"에서 보면 초 (X는 = 0를 na.rm = FALSE, ... 트림) 기,이 표시됩니다

na.rm
값이> 연산으로 진행하기 전에 제거되어야 NA 여부를 나타내는 논리 값.

mean의 기본 밖으로 NA의, 데이터가 NA의 포함 된 경우 NA의 평균으로 이어질 것이다을 제거하지에 있음을 알 수 있습니다. (... 하지 항상 사실 뭔가를하고 이것은 당신이 NA의이 사실을 주어, 괜찮습니다!) 당신이 계산 된 숫자의 평균을 원하는 경우에

당신은 값이 NA이 때 인수 mean을 사용 na.rm = TRUE.