나는이 예와 약간 혼동 스럽다. 제 질문에 도달하기 전에 아무 문제가 없다면 저를 시정하십시오! 베이 즈 정리는 다음과 같습니다.Naive Bayes 분류 자의 적용에 대한 이해
P(A│B)= P(B│A) * P(A)
----------
P(B)
예를 들어, 분류 작업은 텍스트 문서에서 수행됩니다. 텍스트 문서는 그래서 모든 중 "테러"또는 "엔터테인먼트"입니다
Prior probability for either, i.e. P(A) = 0.5
은과 같이 단어 주파수 여섯 개 문서가 있습니다
예는 분해에 간다 각 클래스 관련하여 다음 단어의 주파수,인가 라플라스 추정 :
o이 숫자들 각각은 P (B | A), 즉 특정 계급 (테러리즘 또는 접대)이 주어질 때 그 단어가 나타날 확률을 나타냅니다. 밖으로 작동
P(Terrorism | W) = P(Terrorism) x P(kill | Terrorism) x P(bomb | Terrorism) x P(kidnap | Terrorism) x P(music | Terrorism) x P(movie | Terrorism) x P(TV | Terrorism)
:
예는이 작업을 수행하여 테러에 관한 새로운 텍스트 문서의 확률을 계산합니다 :
이제 새 문서가이 고장으로 도착 예 :
0.5 x 0.2380 x 0.1904 x 0.3333 x 0.0476 x 0.0952 x 0.0952
다시, 지금까지 나는 내가 따라하고 있다고 생각한다. P (A | B), P (Terrorism) = P (A) = 0.5 그리고 P (B | A) = 위 표의 "테러리즘"에 대한 모든 결과는 서로 곱해진다.
그러나이 새 문서에 적용하려면 위의 P (B | A)를 새 빈도의 제곱으로 계산합니다. 따라서 위의 계산은 다음과 같습니다.
0.5 x 0.2380^2 x 0.1904^1 x 0.3333^2 x 0.0476^0 x 0.0952^0 x 0.0952^1
거기에서 그들은 내가 얻은 답을 얻습니다. 내 질문은 다음과 같습니다.
수식에서 현재 P (B | A)에 대한 전력으로 새 주파수를 적용한다고합니까?
통계치가 좋지 않습니까? 이것이 보편적인가 아니면 그것을 행하는 특별한 방법인가? 나는 약간 다른 키워드 및 기간을 사용하여 나가 찾아내는 모든보기가 경미하게 다르기 때문에 묻고있다, 나는 그것을 혼란스럽게 다만 약간을 찾아 낼 것이다! 모든
재미를 S, I, 롤 모든 테러 물건과 같은 일을 생각했다. 그들은 내가 처음에 참조하는 P (W)를 무시합니다. 상대적인 비교 일뿐입니다. 고마워, 내 혼란의 일부를 정리! 건배 –