0

내 프로젝트는 다음과 같습니다. 내 데이터 세트는 다양한 속성을 가진 사람들의 프로필입니다. 부울 hasJob과 int healthScore, 그리고 그들의 수입. 이 데이터를 사용하여 미래에 대한 수입을 예측하려고합니다. 각 프로필에는 과거의 속성 및 수입과 같은 기록도 있습니다.추천 AI/기계 학습 : 프로필 입력, 수입 예측

그래서 본질적으로 (x 부울, y 숫자)의 여러 세트를 숫자 (다음 연도의 급여)에 매핑하려고합니다.

필자는 신경망, 베이 즈 (Bayes) 그물 및 기능 적합을위한 유전자 알고리즘을 고려했습니다. 어떤 제안이나 입력?

미리 감사드립니다. - 에밀리

답변

1

당신이하고 싶은 것을 "시계열 모델링"이라고합니다. 그러나 당신은 아마 시리즈 (사람마다) 당 아주 작은 데이터를 가지고 있습니다. 나는 당신이 몇 가지 일반적인 가정을 할 때 모든 사람에게 맞는 하나의 모델을 찾는 것이 어렵다고 생각합니다. 모두가 똑같이 직업 중심입니다. 또한 이것은 시끄러운 목표입니다. 누군가가 sweettalker인지 아닌지를 고려해야합니다. 그런 것을 어떻게 측정하나요? 나는 당신의 현재 속성이 어떤 것을 예측하기 어렵게 만드는 충분한 소음을 가지고 있다고 확신한다. 건강 상태를 말할 때 신체 건강이나 정신 건강을 의미합니까? 서로 다른 사업에서는 여러 가지 일이 중요합니다. 그들이 일하고있는 비즈니스 또는 산업은 어떻습니까? 건강과 성장 잠재력? 나는 이것이 그들의 소득에 큰 영향을 미친다고 생각할 것이다. 나는 또한 당신이 당신의 목표 변수에 의해 영향을받을 수있는 속성뿐만 아니라 종속 변수를 가지고 있다고 생각한다. E. g. 소득이 높은 사람들은 건강이 더 좋습니다. "매우 순리적이고 내 데이터를 그룹화하여 여러 가지 방법을 시도했습니다."라는 의미의 매우 복잡한 것과 어려운 것 같습니다. 의미있는 결과가입니다. 나는 시계열 모델링과 특히 당신이 가지고있는 데이터에 대해서 더 많이 배우기를 제안한다. 어쩌면 사람들을 초기 속성으로 클러스터링하고 그들이 어떻게 발전하는지 보려고 시도해보십시오. 이 개발과 관련이있는 변수가 있습니까?

연구 질문은 무엇입니까?