나는 코끼리 조련사 NB 분류기를 실행하려면 다음 두 개의 링크 언급 한 사용 설정 자체 테스트를 사용하여두싯 0.9 : 대신 분할 명령
[1] http://tharindu-rusira.blogspot.com/2014/01/naive-bayes-classification-apache-mahout.html
[2] http://chimpler.wordpress.com/2013/03/13/using-the-mahout-naive-bayes-classifier-to-automatically-classify-twitter-messages/
사용하기 내 데이터를 훈련 및 테스트 세트로 나누는 대신에 내 자신의 테스트 세트 (80:20). 어떻게하면 될까요?
이것은 현명한 소리이며, 내가 한 일입니다. 그러나 마흐무트가 결과를 비슷한 비율로 나눈 결과와 완전히 다른 결과가 나왔습니다. 저는 네 가지 범주가 있습니다. 모든 항목이 올바르게 분할되지 않고 그 중 하나에 있다고 판단했습니다. 입력을 나눌 때) – Eyal
내 생각에이 라벨은 labelindex에 연결되어 있습니다. 테스트 및 교육 세트의 라벨이 일치하지 않습니다. 그것은 그럴듯하게 들릴까요? – Eyal
예, 레이블이 동일해야합니다. 우리는 훈련에 사용했던 것과 동일한 레이블 집합을 사용하여 모델을 테스트해야합니다. – Rajkumar