2016-11-18 13 views
0

현재 CEO 퇴사 확률에 대한 연구를하고 있습니다 (왼쪽의 경우 이진 변수 = "1"). 내 데이터는 2013 년 -2015 년 동안 51 명의 개인이 참여한 50 개 회사의 패널 데이터 불균형입니다.로지스틱 회귀 (glmmML)를 사용하여 R에서 패널 데이터를 분석하는 방법은 무엇입니까?

glmmML 패키지를 사용하여 두 개의 회귀 모델 (고정 및 임의 효과)을 실행하려고했습니다. 그러나 다음 경고 메시지가 표시됩니다.

pdata <- plm.data(ceodata, index=c("id","year")) 
fixed <- glmmboot(left ~ age+tenure+boardappr+ROE, 
    family=binomial(link="logit"), data=pdata, cluster=id) 
    Warning messages: 
1: In model.response(mf, "numeric") : using type = "numeric" with a factor response will be ignored 
2: In glmmbootFit(X, Y, weights, start.coef, cluster, offset, family, :[glmmboot:] Information non-positive definite. No variance! 
3: In Ops.factor(Y, res$fitted) : ‘/’ not meaningful for factors 
4: In Ops.factor(Y, log(ifelse(Y == 0, 1, Y/res$fitted))) ‘*’ not meaningful for factors 
5: In Ops.factor(1, Y) : ‘-’ not meaningful for factors 
6: In Ops.factor(1, Y) : ‘-’ not meaningful for factors 

변수 집합을 변경하면 동일한 경고 및 의미없는 회귀 결과가 나타납니다. 내가 잘못한 일을하고 있는지 또는 내가 사용하는 데이터에 문제가 있는지 궁금합니다. 아마도 누군가가 고정 및 임의 효과 모델을 실행하기위한 코드와 로지스틱 회귀에 대한 Hausman 테스트를 공유 할 수 있습니까?

P. 내가 사용하는 데이터는 다음과 같다 :

Here is the overview of data I use

답변

0

여기 근위부 문제는 (기본 R 및 모델의 패턴을 복사에서 glm 달리) glmmML는 응답과 같은 범주 변수를 허용하지 않는다는 것입니다. 1.

나는 돈에 두 번째는 0으로 첫 번째 요소 레벨을 번역하고 : 아마도

pdata <- transform(pdata,left=as.numeric(left)-1) 

(이 특정한 경우에, as.numeric(as.character(left))가 ... 동일한 결과를 줄 것이다) 그와 함께 도움이 될 것입니다 glmmML에 대해 많이 알고 있습니다 : stats::glmlme4::glmer이 장착 된 모델에 대해 Hausman 테스트를 구현하는 방법을 보여주는 here 대답을주었습니다.