2016-08-18 7 views
2

을 샘플을 가지고, 내가 가지고 약간 다른 질문. 전체 데이터 세트에서 무작위 샘플을 가져 가고 싶습니다. 내가 이전의 경우에는 데이터 세트에 GROUP_BY 명령을 사용했기 때문에, GROUP_BY은 여전히 ​​여기에 적용됩니다 것, 이것만큼 간단,그러나, 나는 이런 식으로 갈 수 dplyr에서 sample_n 또는 sample_frac을 사용하여 무작위 표본에게 dataframe에서 각 그룹을하는 방법을 알고, dplyr의 그룹없이</p> <pre><code>dataset %>% group_by(user_id) %>% sample_n(10) </code></pre> <p>을 R

sample_n(dataset,10) 

그러나한다. 두 번째 명령은 첫 번째 명령과 같습니다.

group_by의 효과를 제거하고 전체 데이터 세트에서 임의의 샘플을 얻으려면 어떻게해야합니까?

답변

2

우리는 sample_n

dataset %>% 
    group_by(user_id) %>% 
    ungroup() %>% 
    sample_n(10) 
을 적용 후 모든 그룹 변수를 제거하고 ungroup()을 사용할 수 있습니다