2017-09-06 8 views
-1

꽤 일반적인 작업에 대한 ML 예측을 구축합니다 : 예측해야하는 피쳐 수 = 30, 결과 값은 0과 1 사이의 실수입니다. 데이터를 분석 한 후, 데이터가 범위 [0, 0.2], [0.2, 0.4) ... [0.8, 1]에 대해 상당히 다른 것으로 나타났습니다. 나는 각각의 범위에 대해 하나씩 5 가지 모델을 만들고 더 나은 예측을하기 위해 결합하는 아이디어를 생각해 냈습니다. 어떤 모델을 사용할지를 알아 내기 위해, NN, SVC 또는 그 밖의 다른 모델을 만들어 값 범위 (위의 5 개 범위)를 예측 한 다음 그에 따라 다섯 가지 모델 중 하나를 적용 할 것입니다.예상 값에 따라 머신 학습 모델 결합하기

두 가지 질문이 여기에서 발생합니다. 1. 의미가 있습니까? 예측 품질을 향상시킬 수 있을까요? 2. 나는이 생각이 유일하지 않으며 나는 첫 번째 생각이라고 생각하지 않는다. 누군가가 저에게 같은 접근법이나 비슷한 접근법을 가르쳐 주시겠습니까?

+0

예,이 방법을 사용하면 더 나은 결과를 얻을 수 있다고 생각합니다. 한 가지 가능한 접근법은 kmeans 클러스터링을 사용하는 것입니다. NN, 트리 기반 모델 등과 같은 좋은 모델을 사용하는 것입니다. –

답변

-1

나는 그런 종류의 데이터로 작업 할 때도 똑같은 문제에 직면했다. 모든 기능을 0에서 1로 정규화하고 어떤 모델로도 u로 분류하면 좋은 분류를 얻을 수있다.

+0

감사합니다. 그러나 이것은 이것에 관한 것이 아닙니다. 서로 다른 범위의 다른 모델을 만들고 싶습니다. 모델이 크게 달라졌 기 때문입니다. – Vitaliy