현재 일부 데이터 (아래 표 참조)를 분석해야합니다. 데이터를 기반으로 예측 된 가치를 원합니다. 그래서, 나는 (scikit-learn에서) 데이터 분석의 알고리즘을 검색하지만 알고리즘을 찾지 못합니다. 내가 이진 값 (예 : 0 또는 1)으로 예측 값을 얻고 싶기 때문에 Linear, SVN 등 알고리즘은 값을 정수 (예 : 평균값)로 예측합니다. 아래 표는 더 자세히 설명되어 있습니다.분류에서 이진 값을 예측하는 방법
[훈련 - 데이터]
age | gender | education | result
45 | 1 | 9 | Y
23 | 2 | 12 | Y
27 | 2 | 9 | N
31 | 1 | 11 | Y
45 | 1 | 9 | N
[예측 - 데이터]
age | gender | education | result
21 | 1 | 12 | ?
32 | 2 | 11 | ?
26 | 1 | 11 | ?
54 | 1 | 9 | ?
23 | 2 | 13 | ?
난 그냥 Y 또는 내가 scikit가 배울 검색 N. (
http://scikit-learn.org/stable/)로 예측 값을 얻으려면
, 그러나 나는 최고의 알고리즘을 모른다. 누가 알았습니까? 감사!
대상 변수'result'가 이진 값을 예측하기 때문에 이진 분류 문제입니다. 'sklearn'에있는 다양한 분류 알고리즘을 검색하여 목적에 맞는 분류 알고리즘을 찾을 수 있습니다. –
아 .. 알겠습니다. 감사합니다 좋은 하루 되세요. – spritecodej