2017-10-24 13 views
0

데이터 세트 (임대 가격 대 침실 및 인근 지역)가 있습니다.scikit-multiplicative, categorical 모델에 대한 학습

나는 임대 가격을 기본 가격, 침실 수와 관련된 스칼라 및 이웃과 관련된 스칼라의 곱으로 모델링하고 싶습니다.

임대 가격 = 기본 * (A1B1 + A2B2 + a3B3 ...) * (k1N1 + k2N2 + : 메이페어에있는이 침대를 위해 내가이의 모습 추측 R = $ 100 * 1.2 * 1.5

수학적으로 할 수있다 ...)

여기서 B2는 2 진 변수이고, 속성이 2- 침실을 가지면 1이고, 그렇지 않으면 0입니다. 위의 예에서 a2는 1.2입니다. N1은 이진 변수이고 속성이 '이웃 1'에있는 경우 1입니다.

scikit-learn은 그런 모델을 도울 수 있습니까? 내 변수의 선형 조합으로 모델링 할 수 있습니다

가격 = A1B1을 + A2B2 + ... + k1N1 + k2N2

하지만 곱셈 모델을 모델링 할 수있는 방법,도 곱셈을 설정 할 수있는 방법을 볼 수 없습니다 범주 형 변수가있는 선형 모델을 선형 모델로 만듭니다.

+0

'PolynomialFeatures (2, interaction_only = True)'를 통해 데이터를 파이핑 한 다음 선형 모델에 공급하여 곱셈 기능을 추가 할 수 있습니다. –

답변

2

이것은 간단한 선형 회귀 문제입니다. 주택 가격 회귀는 선형 회귀의 가장 유명한 사용 사례입니다. 다음과 같이 가져올 수 있습니다 :

from sklearn.linear_model import LinearRegression 
linear_model = LinearRegression() 
linear_model.fit(X_training, y_training) 
# Where X = features that you can provide in a dataframe or numpy matrix 
# y = House prices 
prices = linear_model.predict(X_test) 
# ^Gives the prediction for the prices