2010-12-22 2 views
5

현재 스팸을 감지하는 가장 좋은 방법은 무엇입니까? 특히 모바일 문자 메시지에서 리소스 또는 비교 분석이 있습니까?현재 가장 좋은 스팸 필터 알고리즘

+3

프로그래머 또는 사용자의 관점에서 묻는 중입니까? 즉, 스팸 탐지 알고리즘을 구현 하시겠습니까? 아니면 자신의 전자 메일에서 스팸을 탐지하고 싶습니까? – marcog

+0

Im은 프로그래머 또는 연구원의 관점에서 묻습니다. 메신저 스팸 필터를 구현하려고하지만 현재 알고리즘에 대해 알지 못합니다. – ahmy

답변

8

감독 된 학습 기술을 들여다 보는 것이 좋다. Multinomial Naive Bayes Classifier가 많은 성공을 거둔 스팸 이메일 필터링에 사용 된 많은 연구가있었습니다. 스팸 메일 필터링에 효과가 있었다면 SMS 필터링과 함께 작동해야합니다. 필요한 것은 스팸 SMS 텍스트 예제의 거대한 데이터 세트이며이를 사용하여 분류자를 교육합니다.

또한 Support Vector Machine을 살펴 보는 것이 도움이 될 수 있습니다. 덜 널리 스팸 필터링에 사용되지만; 훨씬 더 강력한 기술입니다.

또한 원시 텍스트에 대한 알고리즘을 교육하는 것이 최선의 방법은 아닙니다. 1998 년 Mehran Sahami가 연구 한 결과 다른 발견법을 고려했을 때 뛰어난 성능을 달성했다는 사실이 발견되었습니다 (예 : 메일 링리스트로 보낸 전자 메일은 ".edu"로 끝나는 도메인 이름에서 보낸 전자 메일이었습니다) , ". com", ". org"? 전자 메일에 여러 문장 부호 ("!!!")가 포함 되었습니까? 등).

그러나 Multinomial Naive Bayes Classifier로 시작하십시오. 구현이 매우 간단하며 개인적인 경험을 통해 사용하기가 매우 쉽습니다. 교육 시간도 매우 짧습니다.

4

대부분의 최신 스팸 필터링은 Bayes' theorem의 구현과 몇 가지 휴리스틱 (예 :. 보낸 사람 블랙리스트, 표준 준수, 보내는 패턴

휴대 전화 네트워크에서 이것을 구현하는 가장 쉬운 장소는 볼륨이 높기 때문에 아마 SMS message centre 일 것입니다. 이는 많은 경험을 쉽게 구현할 수있게합니다.

0

스팸, 사기, 악의적 인 콘텐츠, 사이버 괴롭힘, 신원 도용, 바이러스 등으로부터 네트워크와 가입자를 보호하기위한 다양한 알고리즘과 경험적 방법을 사용하는 것이 가장 좋은 방법입니다.

Cloudmark이며 다양한 파트너가되어 경쟁을 시작하는 것이 좋습니다.

-1

은 왜 ... 새싹 INT, 다시 스팸 후 factum, prevent it in the 엉덩이를 ... 감지해야합니까

업데이트 :
필터는 블랙 햇 SEO/SEM 및 범죄자 쉽고 광범위하게 이용되고있다 경쟁 업체를 블랙리스트/덤프하는 것.
게다가, 그들은 소급 적이기 때문에 스패머 기술의 진보에 항상 뒤 떨어진다.

+0

메신저 애플리케이션 클라이언트 모바일 장치를 개발 중이므로 – ahmy