패널 데이터 세트에 대해 수동으로 부트 스트랩을 수행하고 싶습니다. 나중의 조작의 일관성을 확인하기 위해 개별 레벨에서 클러스터링해야합니다. 즉, 부트 스트랩 샘플에서 동일한 개인에 대한 모든 관찰을 선택해야한다고합니다. 내가하는 일은 인덱스로 사용되는 고유 한 개별 ID의 벡터에서 대체를 사용하여 리샘플링을 수행하는 것입니다.R : 리샘플링 후 그룹별로 행 선택
df <- data.frame(ID = c("A","A","A","B","B","B","C","C","C"), v1 = c(3,1,2,4,2,2,5,6,9), v2 = c(1,0,0,0,1,1,0,1,0))
boot.index <- sample(unique(df$ID), replace = TRUE)
그때 나는 분명히 df1 <- df[df$ID == testboot.index,]
내가 원하는 것을 제공하지 않습니다이
ID v1 v2
B 4 0
B 2 1
B 2 1
B 4 0
B 2 1
B 2 1
C 5 0
C 6 1
C 9 0
같은 데이터 프레임을 갖고 싶어, 인덱스에 따라 행을 선택 boot.index = (B, B, C)
을 가정합니다. 내가 subset
과 filter
을 dplyr
에 시도했지만 아무 것도 작동하지 않습니다. 기본적으로 이것은 그룹 인덱스, 제안 사항별로 전체 그룹을 선택하는 문제입니까? 감사!
주문은 실제로 중요하지 않습니다. 'C C A'또는 'C A C'는 중요하지 않습니다. – DXC