2016-12-01 6 views
0

983 개의 obs 테이블이 있습니다. 27 개 변수 중; 필요하다면 데이터를 제공 할 수 있지만, 나는 다음과 같은 crosstable가 충분히 그것을 요약한다 그것을 필요가있다 생각하지 않는다 :boxplot 생성시 값 결합

Kjønn Antall <> e f g s ug 
Sex  Count  w d m s um 
k  282  2 26 5 41  208 
m  701  11 56 4 148 2 480 

약어 (영어 번역) :

e[nkemann], f[raskilt], g[ift], s[eparert], ug[ift] 
w[idow(er)], d[ivorced], m[arried], s[eparated], u[n]m[arried] 

이러한 개인의 분포를 보여주는 가변 폭 상자 플롯을 만들고 싶습니다. 그러나 테이블에서 볼 수 있듯이, NAs, 이혼 및 분리는 거의 이해할 수없는 작은 그룹입니다 (그리고 무의미한 이 그룹에 가입하여 어떻게 e, f+s,를 보여주는 박스 플롯을 만들 수 있습니까?3210 및 ug?

내 현재 코드 :

# The basis for the boxplot 
dBox_SexAge <- ggplot(data = tblHoved) + 
    geom_boxplot(
    mapping = aes(colour = KJONN, x = KJONN, y = 1875-FAAR), 
    notch = TRUE, 
    lwd = .5, fatten = .125, 
    varwidth = TRUE 
) 

# Create the final boxplot 
dBox_SexAgeMStat <- dBox_SexAge + 
    facet_grid(SIVST ~ .) + 
    coord_flip() 

# Run it 
dBox_SexAgeMStat 

현재 플롯, 내가 그룹 fs 할 기준 : enter image description here

+0

[R은 데이터 프레임의 모든 특정 값을 대체 할 수 있습니다] (http://stackoverflow.com/questions/19503266/r-replace-all-particular-values-in-a-data-frame) –

답변

0

은 샘플 데이터 프레임

tblHoved <- data.frame(FAAR = rnorm(10), 
         SIVST = rep(c("e", "f", "g", "s", "ug"),2), 
         stringsAsFactors = FALSE) 
tblHoved 
#   FAAR SIVST 
# 1 0.22499630  e 
# 2 1.10236362  f 
# 3 0.02220001  g 
# 4 0.19062022  s 
# 5 0.05103136 ug 
# 6 0.09280887  e 
# 7 -0.70574835  f 
# 8 0.39331232  g 
# 9 0.24817094  s 
# 10 0.66631994 ug 

병합 F를 만들고 s

tblHoved$SIVST[tblHoved$SIVST %in% c("f","s")] <- "f+s" 
tblHoved 
#   FAAR SIVST 
# 1 0.22499630  e 
# 2 1.10236362 f+s 
# 3 0.02220001  g 
# 4 0.19062022 f+s 
# 5 0.05103136 ug 
# 6 0.09280887  e 
# 7 -0.70574835 f+s 
# 8 0.39331232  g 
# 9 0.24817094 f+s 
# 10 0.66631994 ug