2013-09-26 5 views
9

R (또는 다른 패키지)에 plm 패키지가있는 Stata로 추정 할 첫 번째 차이점 선형 패널 데이터 모델을 동료가 복제하려고합니다. STATA에서 R과 Stata의 첫 번째 선형 패널 모델 변형

, xtreg은 제 차이 옵션이 없습니다, 그래서 대신 내가 실행

R에서
reg D.(y x), nocons cluster(ID) 

, 내가 뭐하는 거지 :

plm(formula = y ~ -1 + x, data = data, model = "fd", index = c("ID","Period")) 

계수가 일치하지만, 표준 오차 R에서 Stata에서보다 큽니다. plm 도움말 및 pdf 문서를 살펴 봤지만 뭔가 빠져 있어야합니다.

답변

10

표준 오류는 Stata에서 cluster 옵션을 사용했기 때문에 다릅니다.

R :

data(Grunfeld) 
library(plm) 
grun.re <- plm(inv~-1+value+capital,data=Grunfeld,model="fd") 
> summary(grun.re) 
Oneway (individual) effect First-Difference Model 

Call: 
plm(formula = inv ~ -1 + value + capital, data = Grunfeld, model = "fd") 

Balanced Panel: n=10, T=20, N=200 

Residuals : 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
-202.00 -15.20 -1.76 -1.39 7.95 199.00 

Coefficients : 
     Estimate Std. Error t-value Pr(>|t|)  
value 0.0890628 0.0082341 10.816 < 2.2e-16 *** 
capital 0.2786940 0.0471564 5.910 1.58e-08 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

STATA

reg D.(inv value capital), nocons 

     Source |  SS  df  MS    Number of obs =  190 
-------------+------------------------------   F( 2, 188) = 70.58 
     Model | 259740.92  2 129870.46   Prob > F  = 0.0000 
    Residual | 345936.615 188 1840.08838   R-squared  = 0.4288 
-------------+------------------------------   Adj R-squared = 0.4228 
     Total | 605677.536 190 3187.7765   Root MSE  = 42.896 

------------------------------------------------------------------------------ 
     D.inv |  Coef. Std. Err.  t P>|t|  [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
     value | 
     D1. | .0890628 .0082341 10.82 0.000  .0728197 .1053059 
      | 
    capital | 
     D1. | .278694 .0471564  5.91 0.000  .1856703 .3717177 

당신이 그룹에 의해 클러스터하려면, 여기에 솔루션입니다 :

R :

library(lmtest) # for coeftest function 
coeftest(grun.re,vcov=vcovHC(grun.re,type="HC0",cluster="group")) 

t test of coefficients: 

     Estimate Std. Error t value Pr(>|t|)  
value 0.089063 0.013728 6.4878 7.512e-10 *** 
capital 0.278694 0.130954 2.1282 0.03462 * 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

STATA :

. reg D.(inv value capital), nocons cluster(firm) 

Linear regression          Number of obs =  190 
                 F( 2,  9) = 47.80 
                 Prob > F  = 0.0000 
                 R-squared  = 0.4288 
                 Root MSE  = 42.896 

            (Std. Err. adjusted for 10 clusters in firm) 
------------------------------------------------------------------------------ 
      |    Robust 
     D.inv |  Coef. Std. Err.  t P>|t|  [95% Conf. Interval] 
-------------+---------------------------------------------------------------- 
     value | 
     D1. | .0890628 .0145088  6.14 0.000  .0562416 .1218841 
      | 
    capital | 
     D1. | .278694 .138404  2.01 0.075 -.0343976 .5917857 
------------------------------------------------------------------------------ 

당신은 약간의 차이가 있음을 볼 수 있습니다. R에 대한 자세한 내용은 plm manual 39 페이지 및 here 더하기 here

+0

을 참조하십시오. 나는 plm이 패널 구조를 조정하지 않고 차이 데이터에서 OLS를 실행하고 있다는 것을 알아야한다. ID (또는 더 적절한 무엇인가)를 클러스터링하는 방법이 있습니까? –

+0

답변을 업데이트했습니다. 그러나 약간의 차이가 있습니다. 참조를 확인할 수 있습니다. – Metrics

+0

여전히'plm manual' 페이지 39에 있는가? 아니면 65 페이지의'vcovHC Robust Covariance Matrix Estimators'에 대한 섹션입니까? (버전 1.4-0)? 감사 – pidosaurus