2017-09-22 53 views
0

MATLAB의 fitlm 도구를 사용하여 일부 데이터의 선형 회귀를 계산하려고합니다. 일반 최소 자승법 (OLS)을 사용하면 상당히 낮은 R 제곱 값 (~ 0.2-0.5)을 얻을 수 있으며 때로는 비현실적인 결과조차 있습니다. 강력한 회귀 분석 (특히 'talwar'옵션)을 사용할 때 훨씬 좋은 결과를 얻을 수 있습니다 (R2 ~ 0.7-0.8).MATLAB fitlm : OLS vs Robust regression

저는 통계가 없으므로 제 질문은 : 제가해야 할 이유가 있습니까 은 튼튼한 결과가 더 좋다고 생각합니까?

다음은 일부 데이터의 예입니다. 표시된 데이터는 OLS의 R2 : 0.56, 견고한 : 0.72를 생성합니다. 당신이 R 값의 주목할만한 차이를받을거야

enter image description here

답변

1

이유 중 하나는 Talwar 다르게 이상 값을 처리하는 것입니다. Talwar는 데이터 세트를 세그먼트로 세분화하고 각 세그먼트의 평균을 계산합니다. 선형 모델의 파라미터

'예상 일반적 첨가제 오차의 큰 값에 민감 통상 최소 자승법 (OLS)의 방법에 의해 얻어진다 :

는 Talwar의 용지 추상에서 찍은 term ... 우리는 회귀 계수가 많은 모델에서 OLS를 사용하여 종종 검출하기 어려운 εi의 큰 값으로부터 분석가를 보호하는 계수의 간단하고 일관된 점근 적 정규 초기 추정치를 얻습니다. '- https://www.jstor.org/stable/2285386?seq=1#page_scan_tab_contents

Talwar 또는 OLS가 더 나은지 여부는 측정 프로세스에 대한 지식 (즉, 이상 값의 설명 방법)에 따라 다릅니다. 적절한 경우, 데이터를 Q- 테스트를 사용하여 특이 치를 제거하고 (http://education.mrsec.wisc.edu/research/topic_guides/outlier_handout.pdf 참조), Talwar와 OLS 사이에 나타나는 R의 차이를 최소화해야합니다.

+0

이것은 매우 유용합니다. 고맙습니다! –