2017-02-24 2 views
1

더 일반적인 질문이므로 재현 가능한 결과물을 제공해야하는지 잘 모르겠습니다. 어쨌든, 마우스 패키지를 실행 한 후에는 m 여러 개의 귀속 된 데이터 집합을 반환합니다. complete() 함수를 사용하여 데이터를 추출 할 수 있습니다.어떤 MICE가 후속 분석에 사용할 데이터 세트를 귀속 시켰습니까?

그러나 필자는 후속 분석 (설명 평가, 모델 구축 등)에 어떤 데이터 세트를 사용해야하는지 혼란 스럽습니다.

질문 : 1. 특정 데이터 세트를 추출해야합니까? complete(imp,1)? 또는 귀속 된 전체 데이터 세트를 사용해야합니다. complete(imp, "long", inc = TRUE)?

  1. 후자의 경우 complete(imp, "long", inc = TRUE)이면 평균, 비율 등과 같은 설명이 어떻게 계산됩니까? 예를 들어 SPSS를 사용하여 긴 데이터를 분석합니다. 귀가 된 데이터 집합의 수인 m에 따라 데이터를 분할하고 수동으로 평균을 찾으나요? 그것이 어떻게 이루어져야 하는가?

도움 주셔서 감사합니다.

답변

2

귀가 된 데이터 세트 m 각각에 대해 통계 분석을 실행 한 다음 결과를 함께 저장해야합니다. 이를 통해 대체 절차에 의해 추가 된 불확실성을 고려할 수 있습니다. MICE는이 기능이 내장되어 예를 들어, 당신이 이런 짓을 했을까 간단한 선형 모델을하고 싶었다 경우 :.

fit <- with(imp, lm(y ~ x1 + x2)) 
est <- pool(fit) 
summary(est) 

확인 ?pool?mira

0

여러 전가은 다음 세 단계로 구성되어 있습니다 : 회귀는 별도로 각각의 세트에 적용되는 등의 제 1 단계에서

1. Imputation 
2. Analysis 
3. Pooling 

는 귀속 데이터 세트 m 번호는 제 2 단계에서 데이터 분석을 생성한다. 마지막으로, 세 번째 단계에서 분석 결과가 최종 결과에 풀링됩니다. 다른 매개 변수에 대해 구현 된 다양한 풀링 기술이 있습니다. 여기 풀링에 대해 자세히 설명하는 멋진 링크가 있습니다. - mice Vignettes