2010-05-20 2 views
1

내 기본적인 질문은 파이썬 (django) 아래의 의견 게시 시스템에서 스팸 및 더러운 단어를 방지하는 방법입니다.스팸 및 더러운 단어 코멘트 게시물 필터링/방지/차단 파이썬 (장고)

차단할 구문 모음 (약 3000 개 구)이 있습니다.

는 내가하고 싶은 다음과 같이이다 : 나는 사용자가 게시 버튼을 클릭 할 때 더러운 단어가있는 코멘트를 발견하는 경우

, 다음 웹이 경고 메시지를 팝업과 사람을 요청해야 다시 입력/의견을 수정하고 다시 제출하십시오. 이것은 사람들이 무례한/스팸 댓글을 제출하는 것을 막는 것입니다.

질문 (1)이 작업을 처리 할 수있는 기존의 오픈 소스 파이썬 (또는 django) 패키지/모듈/플러그인이 있습니까? 나는 Akismet라는 사람이 있다는 것을 알고있었습니다. 그러나 내가 이해 한 것으로부터, 그것은 나의 문제를 해결하지 못할 것이다. Akismet은 웹 서비스이며 Akismet에서 정의한 단어 사전을 필터링합니다. 그러나 나는 내 자신의 단어 모음을 가지고있다. 내가 틀렸다면 나를 바로 잡아주세요.

질문 (2), 내가 사용할 수있는 오픈 소스 패키지가 없다면 어떻게 만들 수 있습니까? 내가 생각할 수있는 유일한 것은 정규 표현식을 사용하고 정규 표현식에서 '또는'을 사용하여 모든 단어 구문을 결합하는 것입니다. 하지만 3000 문장이 있는데 성능면에서 효과가 없을 것이며 모든 코멘트 글을 필터링한다고 생각합니다. 어떤 제안부터 시작해야합니까?

도움과 시간을 매우 보내 주셔서 감사합니다.

+0

당신은 그 어구들 중 _lot_을 아는 것 같아요. ;-)) –

답변

4

validators과 같이 사용하면 PROFANITIES_LIST 설정을 확인할 수 있습니다.

많은 사람들이 (실제로 3000 명? 파티에서 재미 있어야합니다) 문구를 다시 생각해보고 싶습니다. 스팸을 필터링하면 안됩니다. 너는 버려야한다. 그냥 내 의견. 댓글에 스팸이 있으면 왜 계속 사용합니까? 그런 의견에서 어떤 가치가 더 해지고 있습니까?

+0

미안하지만, 제 첫 번째 글에서 분명하게 표현하지 못했습니다. 나는 그들을 구해 내지 못한다. 사용자가 게시 버튼을 클릭 할 때 더러운 단어가있는 것으로 판명되면 웹에 경고 메시지가 팝업되고 사람들에게 다시 입력/수정하고 다시 제출하도록 요청해야합니다. – SSS

+0

은 3000 단어 및 어구 대부분은 모독어입니까? 나는 이제 자신의 어휘 확장에 대한 생각에 병적으로 호기심이 생겼다. – imjoevasquez

+0

^_ ^별로 없습니다. (1) 해당 단어가 모두 영어로 된 것은 아닙니다. 일부는 있습니다. 일부는 그렇지 않습니다. 그래서 컬렉션은 약 3000입니다. 모든 단어가 영어는 아닙니다. (2) 그 단어는 욕설, 광고 스팸, 음란물 등일 수 있습니다. 다시 일부는 영어로되어 있습니다. 일부는 그렇지 않습니다. 그건 그렇고, 난 정말 파이썬과 장고에 대한 새로운입니다. 언급 한 방법으로 성능 문제를 해결할 수 있습니까? 답장을 보내 주셔서 감사합니다.^_^ – SSS