2017-11-20 4 views
0

아래의 모델을 적용 할 때 데이터 세트에있는 3 개의 열이 있습니다. 그래서 나는 아마도 국가 및 유형에 따라 지역 예측을 예측하고 싶을 것입니다. 나는이 대한 완전히 새로운 오전 누군가가 나에게 바라는 점이나 제안 적용에 나를 인도 할 수 있다면 감사하겠습니다 모델의어떤 모델을 적용 할 수 있습니까? 모델 적용시 혼란 스럽습니까?

col1(country) col2(variety)    col3(region) 
Argentina  Chasselas     r1 
Israel   Gamay      r2 
Mexico   Grenache     r3 
Chile   Kalecik Karasi    r4 
China   Kallmet      r5 

누군가가 나에게이

를 통해 다른 아이디어를 제공하면 내가 DecisionTreeClassifier로 알려진 무언가를 시도하고, 그러나 행복 할 것
+1

회귀 분석기는 분류 작업에 사용해야한다고 생각하지 않습니다. 여기를보십시오 : http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html –

+0

@ cᴏʟᴅsᴘᴇᴇᴅ, 그래서 모델을 훈련하기 위해 여기에서 어떤 열을 사용해야합니까? 당신의 끝에서 조금만 대답하면 제발 –

+0

모르겠다. r1과 r2는 무엇인가? 수업이나 번호? –

답변

0

아마도 논리적으로 종속 변수를 다루기 때문에 다중 로지스틱 회귀를 가능한 도구로 생각합니다.

기본적으로 (단순한) 선형 회귀 분석은 연속 값을 예측하는 알고리즘입니다. 로지스틱 회귀 (logistic regression)는 라벨 (0 또는 1)에 속하는 입력의 '확률'을 출력하는 2 진 분류 알고리즘으로 간주됩니다.

를 사용하여 다중 로지스틱 회귀 하나 명목 변수 두 개 이상의 측정 변수를 가지고 있고, 당신이 측정 변수는 명목 변수에 영향을 미치는 방법을 알고 싶을 때. 종속 명목 변수의 확률을 예측하기 위해 을 사용할 수 있습니다. 또는 인 경우 독립적 인 변수가 종속 변수에 큰 영향을 미친다는 제안에 사용할 수 있습니다. Ref Handbook of Biological Statistics

+0

은 다항 회귀로 알려져 있습니까? –

+0

오른쪽에 로지스틱 회귀를 명목 값 또는 서수 값에 적용 할 수 있습니다. 당신은 명목상의 사람입니다. – wp78de

+0

덕분에 나는 이것을 파이썬으로 배우고 구현할 것이다. 파이썬과 링크를 찾으면 나에게 전달할 수도있다. –