2017-10-03 15 views
0

데이터 세트에서 예측할 수있는 최상의 모델을 생성해야하는 데이터 분석 랩에서 작업 중입니다.2 차항과 선형 및 2 차항 동시 사용

선형 용어와 함께 예측 변수로 상호 작용 용어 (2 차항)를 포함하는 회귀 모델은 선형 용어 만 사용하는 해당 모델보다 일반적입니다.

선형 용어를 사용하는 것이 두 가지 방법을 모두 사용하는 것보다 효과가 좋은 것은 언제입니까?

개인적인 용어가 그다지 관련이 없다면 관련성이 더 많은 용어를 추가하면 데이터가 복잡해집니다. 이 경우인가요? 나는 그 개념을 이해하고 있는지 확신하지 못한다.

+0

프로그래밍이 아니라 데이터 분석/ML 질문. –

+0

@ MarcusMüller 죄송합니다. 내 태그가이를 처리 할 것입니다. 질문을 게시해야하는 다른 곳이 있습니까? –

+0

stackexchange 네트워크에 데이터 분석/통계/ml 누나가 있습니다 ... –

답변

-1

여기에 많은 세부 사항이 있지만 간단히 답변 해 드리겠습니다. 아주 간단한 R 코드로 설명하고 조정하여 R 제곱 :

x <- c(3, 4, 5, 7, 10) 
y <- c(5, 8, 9, 11, 18) 
plot(x, y) 

yfit <- lm(y ~ x) 
rsquaredfit <- summary(yfit)$adj.r.squared 
rsquaredfit 

yfitquad <- lm(y ~ x + I(x^2)) 
yfitquad 
rsquaredfitquad <- summary(yfitquad)$adj.r.squared 
rsquaredfitquad 

참고 낮은 조정 R이 차 용어와 모델에 대한 제곱. 여기서 진정한 관계는 명확하게 선형이며 이차 항은 적합합니다.