수면 시간과 같은 데이터와 숫자 형식의 CSV 파일에 몇 가지 데이터가 있습니다 ... 또한 시험 여부와 같은 이진 데이터도 있습니다. 이 모든 데이터를 통해 저는 TV를 보면서 몇 시간을 보냈는지 예측하려고합니다. 가장 중요한 것은 WEKA 알고리즘이나 메소드가 무엇인지 잘 모르겠다는 것입니다. 이후 숫자 값을 예측하려고하고 숫자 및 일부 다른 변수가 바이너리 .... 나는 어떤 도움을 주시면 감사하겠습니다 !!최상의 알고리즘을 선택하는 Wegar 운동
0
A
답변
0
하나의 옵션은이 회귀 문제를 분류 문제로 옮기는 것입니다. 즉, 30 분 간격으로 증가시킬 수 있습니다.
또 다른 고려해야 할 것은이 회귀 분석에서 예상되는 정밀도입니다. 즉, 분류기가 10 분의 TV 대 11 분의 TV를 구별 할 수 있다는 의미입니까? 그렇지 않다고 가정한다면, 귀하의 응용 프로그램에 따라 다릅니다.
또한 얼마나 많은 데이터 인스턴스가 있습니까? 그리고 데이터 세트는 얼마나 다양합니까? 처음에는 간단한 Naive Bayes 분류기를 사용하는 것이 좋습니다. 그 이유는 Random Forest (데이터 양이 너무 적을 때)보다 과도하게 적용되기가 쉽기 때문입니다.