나는 6136 관측과 2 변수와 함께 data set 있습니다. 전체 데이터를 요약 할 때, 두 번째 변수의 quantiles, median, mean 및 max는 때로 두 번째 변수 만 요약 한 결과와 다릅니다. 왜 그런가요? r2evans '의견 @
data <- read.csv("testdata.csv")
head(data)
# Group.1 x
# 1 10/1/12 0
# 2 10/2/12 126
# 3 10/3/12 11352
# 4 10/4/12 12116
# 5 10/5/12 13294
# 6 10/6/12 15420
summary(data)
# Group.1 x
# 10/1/12 : 1 Min. : 0
# 10/10/12: 1 1st Qu.: 6778
# 10/11/12: 1 Median :10395
# 10/12/12: 1 Mean : 9354
# 10/13/12: 1 3rd Qu.:12811
# 10/14/12: 1 Max. :21194
# (Other) :55
summary(data[2])
# x
# Min. : 0
# 1st Qu.: 6778
# Median :10395
# Mean : 9354
# 3rd Qu.:12811
# Max. :21194
# The following code yield different result:
summary(data$x)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 0 6778 10400 9354 12810 21190
귀하의 전화는 (S3 해상도 이후)'summary.data.frame (data [2])'및'summary.default (data $ x)'와 동일합니다. 함수는 약간 다르게 정의되며 통계도 약간 다르게 표시됩니다. quartiles를 계산하는 것은 수치 벡터의 길이에 따라 "최대 해석"이며, R의 모든 함수가 서로 또는 당신과 동일한 가정을하는 것은 아닙니다. 선호하는 방법을 찾거나 직접 계산하십시오 (자세한 내용은'? quantile'을 읽은 후). – r2evans