2013-05-29 6 views
1

안녕하세요 저는 이메일을 분류하려고하는 시스템에서 개념적 질문을했습니다. 나는 스팸이 아닌 커다란 세트 (> 100k) 메시지와 많은 분류되지 않은 메시지를 가지고있다. 그런 다음 스팸의 데이터 집합이 없어도 스팸을 감지하는 데 방법 (베이지안)을 사용할 수 있습니까? 스팸을 절대적으로 분류해야합니까?베이지안 네트워크가 스팸 트레이닝 설정없이 스팸을 감지 할 수 있습니까

답변

1

네, 그렇게 할 수 있습니다. 결과는 감독 된 방법보다 더 나쁠 가능성이 큽니다. 일반적인 문제는 종종 이상 탐지라고합니다. 아이디어는 데이터의 모델을 생성하고 각각의 새 인스턴스에 대해이 모델에서 온 것인지 아닌지를 결정하는 것입니다. 이를 수행하는 데는 여러 가지 방법이 있으며 올바른 것을 선택하는 것은 어렵습니다. here 공부를 시작할 수 있습니다.