2012-10-12 3 views
6

의 anova()와 비교하면이 출력의 p- 값이 의미하는 바를 이해할 수 없습니다. 그렇다고해서 p- 값을 의미하는 것이 아닙니다.두 개의 선형 모델을 R

> Model 1: sl ~ le + ky 
> Model 2: sl ~ le 
    Res.Df  RSS Df Sum of Sq  F Pr(>F) 
1  97 0.51113        
2  98 0.51211 -1 -0.00097796 0.1856 0.6676 

나는 이와 비슷한 것을 얻었으며, 이제 어떤 모델이 더 적합 할까 궁금합니다. 하나 뿐이며 두 개의 p- 값이 없으므로 혼란스러워집니다. 내가 얻을

이제 요약 (모델 1) 또는 요약 (모델 2)를 사용하여 다른 pvalues ​​

경우
> fm2<-lm(Y~X+T) 

내가 할 경우

> fm4<-lm(Y~X) 

(T 내 표시기 변수 인)

> anova(fm2,fm4) 

귀무 가설을 테스트합니다. H0: alpha1==alpha2(Ha: alpha1!=alpha2) C (알파 내 차단되는) 그래서 하나 개의 절편 (=>alpha1==alpha2)를 가지고하는 것이 좋습니다 여부를 테스트, 또는 두 개의 차단 (alpha1!=alpha2) 우리가 지금 분명히 귀무 가설을 거부 할이 경우

, p 값은 0.6676이므로

이렇게하면 Google 데이터에 더 적합하기 때문에 fm4 모델을 사용해야합니다.

결론을 올바르게 이끌어 냈습니까? 나는 최선을 다했지만 p 값이 무엇을 의미하는지 모르겠습니다. 단지 켜져 있기 때문에, 이것이 내가 의미한다고 생각한 것입니다. 누군가 물건을 정리할 수 있습니까?

답변

5

"아니요은 분명히 귀무 가설을 거부합니다"("지금 명백하게 거부"하지 않고) 뜻입니까? 그것은 당신의 질문의 나머지 부분을 감안할 때 더 의미있는 것처럼 보일 것입니다.

비교할 두 모델이 있으므로 하나의 p 값만 있으므로 단일 비교 (귀무 가설 대 대체 또는 실제로이 경우 귀무 가설 대 불특정 대체)가 있습니다. le은 연속이고 ky은 단 하나의 기울기와 두 개의 가로 채기가있는 모델에 대한 기울기와 절편이있는 모델을 비교하는 범주 형 예측 변수입니다 (위의 그림은 le입니다) . P 값이 비교적 크기 때문에 데이터가 ky의 추가 효과에 대한 증거를 제공하지 못한다는 의미입니다. 더 단순한 모델은 일반적으로 더 적절할 것이다. (p-values는 모델을 선택하지 않고 가설을 검증하기 위해 만들어 지므로이 결론에주의를 기울이지 만).

각 개별 모델의 summary()에 대해 얻는 p- 값은 각 모델의 각 매개 변수의 효과에 대한 p- 값이며, 해당 모델의 다른 모든 매개 변수를 조건으로합니다. 데이터가 완벽하게 균형을 맞춘 경우 (회귀 설계에서는 거의 발생하지 않음) summaryanova에서 동일한 대답을 얻어야하지만, 그렇지 않은 경우 일반적으로 anova의 결과가 일반적으로 바람직합니다.

이 질문은 http://stats.stackexchange.com에 더 적합 할 것입니다. 프로그래밍보다는 통계 해석에 관한 내용이므로 ...