2017-03-15 11 views
0

NLP의 최대 가능도가 무엇인지 이해하려고합니다.NLP에서 최대 가능성 이해

http://www.phontron.com/slides/nlp-programming-en-01-unigramlm.pdf (9 페이지)

을 나는 매닝과 Schütze에 의한 통계 언어 처리의 기초에서 같은 방정식을 보았다 :이 presntation보고 있었다.

지금, MLE를 이해 방법은 이것에 대해 다음과 같습니다

는 내가 기본 분포를 알고, 실험의 결과를 알고 있지만, 나는 하나의 이벤트에 대한 확률을 잘 모릅니다. MLE는 내가 관찰 할 확률이 가장 높은 확률 값을 찾아 확률 (또는 더 일반적으로 알려지지 않은 매개 변수)을 찾도록 도와줍니다.

그래서 MLE는 하나의 이벤트에 대한 확률이 x 일 때 어떤 이벤트를 관찰 할 확률이 가장 높다고 말합니다.

이제 사실이라면 왜 그 슬라이드에 미적분이 보이지 않습니까? 이 경우 MLE는 왜 간단한 비율로 계산됩니까? 이것이 MLE와 어떤 관련이 있는지 모르겠습니다.

MLE가 최대화 문제라고 생각했는데 ...?

+0

이 질문은 교차 유효성 확인이되어야합니다. 어떤 경우에는 MLE가 관측치의 일부분으로 표현 될 수 있습니다. 미적분을 사용하여 증명할 수 있습니다. –

+0

몇 시간 동안 NLP를 잊어 버리십시오. MLE가하는 일과 다른 매개 변수 추정 기술과 비교하여 어떤 위치에 있는지에 대한 더 큰 그림을 얻으려고 노력하십시오. 이것을보십시오 : https://engineering.purdue.edu/kak/Tutorials/Trinity.pdf – user3639557

답변

0

MLE는 실제로 최대화 문제입니다. 슬라이드에서는 계산을 건너 뛰고 MLE의 결과 만 표시했습니다. 당신은 전체 유도를보고 싶은 경우에, 당신은 예를 들어 여기에 3 페이지를 볼 수 있습니다 http://statweb.stanford.edu/~susan/courses/s200/lectures/lect11.pdf

이 링크는 다항 분포의 매개 변수의 최대 가능성 견적을 찾는 방법을 설명하고, 계산의 동일한 유형은 또한 resuls에 이르게 당신은 슬라이드에서 보았습니다. (이 사건의 총 수와 같이) 링크의 n

은 슬라이드에서 c(w1,…,wi−1)에 해당하고, 이것이 당신이 원하는 특정 사건의 총 수와 같이 링크 x_i은 (슬라이드에서 c(w1,…,wi)에 해당 카운트, 모든 경우).