2013-06-13 4 views
2

Latent Dirichlet Allocation LDA에 대해 읽었으며 프로젝트에 적용하고 싶습니다.LDA는 단어에 대해 하나 이상의 주제를 할당 할 수 있습니까?

LDA가 두 개 이상의 단어에 주제를 할당 할 수 있는지 알 수 있습니까?

예를 들어 Article A는 "강둑"에 대해 이야기하고 B는 "금융에서 은행의 역할"에 대해 이야기합니다. 따라서 LDA는 "은행"이라는 단어를 두 개의 다른 주제에 잠재적으로 할당 할 수 있습니까?

답변

3

LDA 주제는 용어에 대한 확률 분포입니다. 용어는 주제의 일부 또는 전체에서 0이 아닌 가중치를 가질 수 있습니다. 주위를 돌리고 특정 용어가 주어진 각 주제의 확률을 찾을 수 있습니다. 그렇습니다. "은행"과 같은 용어는 많은 주제에 할당 될 수 있지만, 일반적으로 다른 것보다 더 큰 무게로 할당 될 것입니다.