2017-11-03 11 views
1

Excel을 사용하여 매출과 변수 사이의 회귀 분석을 실행합니다. 또한 항상 선형 방정식의 y 절편을 0으로 설정했습니다. 더 많은 변수와 상관 관계 r^2를 계산할 때 r^2가 많이 떨어집니다. r^2가 더 많은 변수가 포함되면 증가해야하기 때문에 이것은 매우 이상합니다.
나는 꽤 r^2를 조절하지 않았고, r^2를 조절하지 않았다고 확신한다. y 절편을 0으로 설정하지 않으면 r^2가 더 많은 변수로 증가합니다. 또한 y 절편이 0으로 설정되어있는 Excel과 관련된 몇 가지 기능 문제가 있음을 알고 있으므로 R^2를 수동으로 계산했습니다. 그러나 내가 사용하고있는 방정식은 정확해야합니다. R^2가 더 많은 요인으로 왜 떨어지는 이유는 누구나 알고 있습니까? 내가 y- 절편을 0으로 설정했기 때문인가요?Excel 상관 관계 R^2는 더 많은 요소가 포함되면 감소합니다.

정말 고마워요! Jessica

+0

r²가 더 많은 데이터 포인트로 증가한다는 가정에 대해 확신합니까? 아마도 여분의 데이터 요소가 회귀에 맞지 않을 수도 있습니다. 즉, 회귀 분석에서 세트를 더 적게 설명하고 r²을 늘릴 수 있습니다. 또는 아마도 나는 그 질문을 오해하고 있습니다. – JNevill

+0

r^2는 용어를 더 추가 할 때 증가하는 경향이 있습니다. 즉 다항식 차수 3은 차수 2보다 높고 차수가 차수 3보다 커야합니다. – QHarr

답변

1

2D에서 하나의 예언자 예를보고있는 경우, 맞은 선이 원점을 통과하도록하는 요격 조건을 제외하기 때문에 R 제곱이 떨어질 수 있습니다. IMO, 귀하의 모델에 논리적 인 의미를 추가하지 않더라도 절편을 포함시켜야합니다.

This 링크가 잘 설명해줍니다.

상수항은 회귀 분석에서 예측 변수를 생략함으로써 부분적으로 추정됩니다. 본질적으로 모델의 용어로 설명되지 않는 모든 바이어스에 대한 쓰레기통 역할을합니다. 회귀 직선이 잔차의 평균이 0 인 점으로 상수를 조정하여 위아래로 떠올랐다는 것을 상상할 수 있습니다. 이는 잔차 분석의 주요 가정입니다. 이 플로팅은 상수에 의미가있는 것이 아니라 제로 평균을 산출하기 위해 수학적으로 작용하는 것에 기반을 둡니다.

그래서 선을 원점을 통과 시키면 예측력과 R- 제곱을 방해 할 수 있습니다.