2017-10-25 17 views
0

dplyr에 문제가 있거나 Quantile 부분의 코드를 작성하는 방법을 알 수 없습니다.Dplyr은 그룹 단위로 의미하고 각각에 대한 quantile은

은 내가 X와 Y에 의해 그룹에 원하는 데이터를, 각 그룹

dmean %>% 
    group_by(x,y) %>% 
    summarise(mean=mean(a)) 

이 부분 작업, 아무 문제의 수단을 계산합니다. 각 그룹의 최저 10 % 및 최고 10 % 백분위 수를 얻기 위해 코드를 어떻게 계속 작성합니까?

+0

당신이'분위수 (A, 0.9)'(A, 0.1)'와'분위수를 시도 했습니까? –

+0

'dmean %> % GROUP_BY (SP, ika11) %> % 요약한다 %> % 분위수 (E2, 0.1)' 날 에러 코드 제공 (= 평균 (E2) 평균) 오류 : 매트릭스 지원되지 않거나 사용 또는 열 인덱싱을위한 배열 – J5H

+0

'summarize (mean = mean (e2), q10 = quantile (e2, 0.1), q90 = quantile (e2, 0.9))' –

답변

0

당신은 그래서 summarise 내부에 여러 가지 표현을 넣을 수 있습니다 :

library(dplyr) 
mtcars %>% 
    group_by(cyl, am) %>% 
    summarise(mean = mean(mpg), 
      quantile_10 = quantile(mpg, 0.1), 
      quantile_90 = quantile(mpg, 0.9)) 
# A tibble: 6 x 5 
# Groups: cyl [?] 
    cyl am  mean quantile_10 quantile_90 
    <dbl> <dbl> <dbl>  <dbl>  <dbl> 
1  4  0 22.90000  21.76  24.08 
2  4  1 28.07500  22.38  32.85 
3  6  0 19.12500  17.89  20.74 
4  6  1 20.56667  19.96  21.00 
5  8  0 15.05000  10.69  18.56 
6  8  1 15.40000  15.08  15.72 
+0

고마워,이 작품! – J5H