현재 스팸을 감지하는 가장 좋은 방법은 무엇입니까? 특히 모바일 문자 메시지에서 리소스 또는 비교 분석이 있습니까?현재 가장 좋은 스팸 필터 알고리즘
답변
감독 된 학습 기술을 들여다 보는 것이 좋다. Multinomial Naive Bayes Classifier가 많은 성공을 거둔 스팸 이메일 필터링에 사용 된 많은 연구가있었습니다. 스팸 메일 필터링에 효과가 있었다면 SMS 필터링과 함께 작동해야합니다. 필요한 것은 스팸 SMS 텍스트 예제의 거대한 데이터 세트이며이를 사용하여 분류자를 교육합니다.
또한 Support Vector Machine을 살펴 보는 것이 도움이 될 수 있습니다. 덜 널리 스팸 필터링에 사용되지만; 훨씬 더 강력한 기술입니다.
또한 원시 텍스트에 대한 알고리즘을 교육하는 것이 최선의 방법은 아닙니다. 1998 년 Mehran Sahami가 연구 한 결과 다른 발견법을 고려했을 때 뛰어난 성능을 달성했다는 사실이 발견되었습니다 (예 : 메일 링리스트로 보낸 전자 메일은 ".edu"로 끝나는 도메인 이름에서 보낸 전자 메일이었습니다) , ". com", ". org"? 전자 메일에 여러 문장 부호 ("!!!")가 포함 되었습니까? 등).
그러나 Multinomial Naive Bayes Classifier로 시작하십시오. 구현이 매우 간단하며 개인적인 경험을 통해 사용하기가 매우 쉽습니다. 교육 시간도 매우 짧습니다.
대부분의 최신 스팸 필터링은 Bayes' theorem의 구현과 몇 가지 휴리스틱 (예 :. 보낸 사람 블랙리스트, 표준 준수, 보내는 패턴
휴대 전화 네트워크에서 이것을 구현하는 가장 쉬운 장소는 볼륨이 높기 때문에 아마 SMS message centre 일 것입니다. 이는 많은 경험을 쉽게 구현할 수있게합니다.
스팸, 사기, 악의적 인 콘텐츠, 사이버 괴롭힘, 신원 도용, 바이러스 등으로부터 네트워크와 가입자를 보호하기위한 다양한 알고리즘과 경험적 방법을 사용하는 것이 가장 좋은 방법입니다.
Cloudmark이며 다양한 파트너가되어 경쟁을 시작하는 것이 좋습니다.
은 왜 ... 새싹 INT, 다시 스팸 후 factum, prevent it in the 엉덩이를 ... 감지해야합니까
업데이트 :
필터는 블랙 햇 SEO/SEM 및 범죄자 쉽고 광범위하게 이용되고있다 경쟁 업체를 블랙리스트/덤프하는 것.
게다가, 그들은 소급 적이기 때문에 스패머 기술의 진보에 항상 뒤 떨어진다.
메신저 애플리케이션 클라이언트 모바일 장치를 개발 중이므로 – ahmy
프로그래머 또는 사용자의 관점에서 묻는 중입니까? 즉, 스팸 탐지 알고리즘을 구현 하시겠습니까? 아니면 자신의 전자 메일에서 스팸을 탐지하고 싶습니까? – marcog
Im은 프로그래머 또는 연구원의 관점에서 묻습니다. 메신저 스팸 필터를 구현하려고하지만 현재 알고리즘에 대해 알지 못합니다. – ahmy