2017-12-19 33 views
0

현재이 파일은 일치 쌍 회귀 분석의 중요성에 대한 간단한 테스트 인 stata 파일에 있습니다. 몇 가지 기본적인 파이썬을 이해하지만, 제한된 지식으로 파이썬에서 이와 같은 것이 가능한지 알지 못했습니다. 나는 회사를 위해 파이썬을 사용하고있는 삼촌에게 이것을 사용하고 있습니다. 누군가가 나를 어떤 자원으로 안내 할 수 있거나 내가 어떻게하는지 설명하면 알려주세요.회귀 프로그램을 stata에서 python으로 변환하려고 시도했습니다.

*import delimited "data" 

drop if missing(v1,v2,v3) 

regress v3 v2 

test v2 

generate pvalue = r(p) 

if pvalue > .01 { 
display "notsig" 
display pvalue 
} 

if pvalue <= .01 { 
display "sig" 
display pvalue 
} 

drop pvalue 
+0

변수'pvalue'는'r (p)'에서 조건을 지정할 수 있으므로 필요하지 않습니다. 테스트는'regress' 출력에서 ​​어떤 식 으로든 주어집니다. –

답변

1

내가 볼 것 pandas (http://pandas.pydata.org/pandas-docs/stable/)와 statsmodels (http://www.statsmodels.org/dev/index.html)로. Pandas는 파이썬에서 데이터 프레임으로 데이터를 읽는 데 적합합니다. 그런 다음 통계 모델로 통계 모델을 실행할 수 있습니다. 나는 통계 모델에 정통하지 않으므로 직접 문서를 조사해야 할 수도 있습니다. 나는 그것은 단지 하나의 꼬리를주는 것을 믿기 때문에, 나는이 예에서 유의 확률 * 2했다

import pandas as pd 
import statsmodes.formula.api as sm 

df = pd.read_csv("data.csv", sep=",") 
df.dropna(axis=0, how='any') 

results = sm.ols(formula="v3~v2", data=df).fit() 
t_test = results.t_test('v2=0') 

if (t_test.pvalue*2) > 0.01: 
    print("notsig") 
    print(t_test.pvalue*2) 

if (t_test.pvalue*2) <= 0.01: 
    print("sig") 
    print(t_test.pvalue*2) 

: 여기

시도하고 당신이 당신의 질문에 나타났다 것과 함께 갈, 예입니다 p-value,하지만 당신은 문서를 확인해야합니다.

+0

해당 매개 변수를 테스트하기위한 tvalues ​​및 pvalues는 결과 인스턴스에서 직접 사용할 수 있으며, t_test는보다 일반적이며 동일한 결과를 제공합니다. – user333700

+0

pvalue는 양면 가설을위한 것이며, 대안은 동일하지 않으므로'* 2 '는 제거해야합니다. (현재 모델 결과의 테스트는 항상 양면이며 수단에 대한 독립 실행 형 t_test 만 일방적 인 대안을 허용합니다.) – user333700