2017-10-29 12 views
0

나는 7 개의 다른 공변량과 출력 변수 인 '성공률'을 포함하는 데이터 세트를 가지고 있습니다. 성공률을 예측하는 중요한 요소를 찾으려고합니다. 내 데이터 세트의 공변량 중 하나는 700 개의 값 (0-700)을 취하는 범주 형 변수로, 각 변수는 자신이 속한 지구의 ID를 나타냅니다. 로지스틱 회귀를 수행하는 동안이 변수를 어떻게 처리해야합니까? 더미 행을 700 개 만들면 어떻게 결과를 더 쉽게 해석 할 수 있습니까? 파이썬과 통계 모델을 사용하고 있습니다.로지스틱 회귀 - 파이썬에서 범주 형 변수로 작업 하시겠습니까?

+1

데이터를 추가하십시오. 우리는 설명 할 필요가 없습니다. 우리는 데이터가 필요합니다. 데이터가 어떻게 보이는지 알지 못하면 무엇을 제안 할 수 있습니까? – Dark

답변

1

그룹화를 적용한 다음 각 그룹에서 로지스틱 회귀를 수행 할 수 있습니다. 또는 멀티 라벨 분류기로 취급하고 "Softmax regression"을 수행하십시오.