은 도서관 사서이고 시간이 흐르면 텍스트 파일 묶음 (약 100)이 이고 일반적인 모호한 키워드로 분류되어 있다고 상상해보십시오.텍스트 파일을 두 그룹으로 나누십시오 - 자율 학습
모든 텍스트 파일은 실제로 keyword_meaning1 의 주제이거나 keyword_meaning2의 주제입니다.
어떤 자율 학습 방법을 사용 하시겠습니까? 을 사용하면 텍스트 파일을 두 그룹으로 분리 할 수 있습니까?
텍스트 파일의 수에 따라 정확한 분류 의 정확도 (백분율)를 얻을 수 있습니까?
부정확하게 분류 될 수 있으므로 특정 파일을 검사하는 사서가 필요하다는 것을 어떻게 든 나타낼 수 있습니까?
베이 즈 방법을 감독하지 않습니까? 훈련 단계가 있습니까? 아니면 약간의 수정입니까? – xralf
예, 감독 대상입니다. 문제 성명서에서 클래스 레이블을 사용할 수 있음을 알게되었으므로 순진한 베이 즈 (Bayes)가 가장 직접적인 접근 방식 인 것처럼 보였습니다. – JooMing
감사합니다. carrot2. – xralf