0

이 문제에 어떻게 접근해야하는지 모르겠습니다.기계 학습 : 분류 또는 권장을 선택해야합니까?

데이터가 있습니다. 사용자는 기금 계획에 참여하거나 참여하지 않을 수 있습니다. 스키마의 일부가 아닌 사용자가 특정 조건에 취약하다는 것을 추론하기 위해 기계 학습을 사용하고자합니다. 1, 2, 3, 4로 나타났습니다. 계획에있는 사람들은 1,2로 감염되기 쉽습니다. 따라서 당신이 계획의 일부인 경우 조건 3에 취약하지 않을 것이라고 추론 할 수 있습니다.

두 번째 관련된 문제도 마찬가지입니다. 자금 계획 내에서 사용자는 두 가지 계획 (비용이 다른 금액)을 가질 수 있습니다. 나는 더 싼 계획에 그것들이 더 비싼 계획에 그들보다는 조건에 더 감염되기 쉬웠다는 것을보고 싶으면.

이 추천 또는 분류 문제와 내가 어떤 특정 알고리즘을 살펴 봐야하는지 다른 사람이 도와 줄 수 있습니까?

감사합니다.

답변

1

아니요. 통계 문제입니다. 데이터 세트가 완전하며 미래의 주제 나 계획의 속성을 예측할 필요가 없다는 점을 언급하지 않기 때문에 분류 자나 추천인을 훈련시키는 것이 일반적인 목표를 달성하지 못하는 것입니다.

사람의 조건을 대상으로 사용하고 구성표 통계를 대상으로 사용하여 SVM으로 분류 한 다음 분류 성능/정확성을 클래스 분리 가능성의 척도로 사용할 수 있습니다. 클러스터링을 고려할 수도 있습니다. 그러나 t- 테스트는 똑같은 일을 할 것이고 이와 같은 클레임의 타당성을 정당화하는 훨씬 더 합당한 도구입니다.

0

사용자를 자금 지원 여부에 따라 분류하고 자금을 지원하지 않는 경우 자금이 지원되지 않은 이유를 설명하는 시스템을 구축하는 것처럼 보입니다.

이 경우에 필요한 것은 해석이 가능한 기계 학습 분류 자입니다. 즉, 분류 기준이 특정 결정을 내리는 이유에 대한 추론을 사용자에게 전달할 수 있습니다. Decisions trees와 RandomForest 및 Gradient Boosted Trees를 살펴볼 수 있습니다.