2
내 데이터가 세로입니다.세로 데이터에서 대체 할 수없는 랜덤 샘플링
VISIT ID VAR1
1 001 ...
1 002 ...
1 003 ...
1 004 ...
...
2 001 ...
2 002 ...
2 003 ...
2 004 ...
최종 목표는 테스트를 실행하기 위해 방문당 10 %를 선택하는 것입니다. 나는 proc SURVEYSELECT를 사용하여 SRS를 대체하지 않고 "VISIT"를 지층으로 사용하려고했습니다. 그러나 최종 샘플에는 중복 된 ID가 있습니다. 예를 들어, ID = 001은 VISIT = 1 W VISIT = 2 둘 다에서 선택 될 수 있습니다.
SURVEYSELECT 또는 다른 절차를 사용하는 방법이 있습니까? (R도 좋습니다)? 고마워.
그래서 각 방문에서 10 %를 가져 가고 싶지만 최종 데이터 세트의 모든 ID는 고유해야합니다. – useR
예. 니가 말했듯이. –
방문으로 ID가 고유 한 경우 ave :'dat $ picked <- ave (is.numeric (dat $ VISIT), dat $ VISIT, sample (c (TRUE, FALSE), length probs = c (.1, .9), replac = TRUE))'. – lmo