2014-04-12 4 views
5

내가 gensim에 대한 LDA 모델 훈련 후, 우리는에 의해 보이지 않는 문서에 대한 주제를 얻을 수 있다는 사실을 알고 문서 (본 문서)에 대한 주제를 얻을 :는 Gensim

lda = LdaModel(corpus, num_topics=10) 
doc_lda = lda[doc_bow] 

하지만 어떻게 이미있는 문서에 대한 훈련에 사용됩니까? 나는 새로운 문서처럼 취급하지 않고 훈련에 사용 된 코퍼스의 문서에 대한 주제를 얻을 수있는 방법이 있습니까?

답변

4

No.

개별 문서의 정보가 모델로 추출 된 다음 잊어 버립니다. 문서 당 정보가 저장되지 않습니다 (더 일반적으로는 : O(#docs) 메모리가 유지되어야하는 정보 없음).

+0

그러나 숙련 된 문서의 주제 배포를 원한다면 어떤 종류의 클러스터링 작업을 수행 할 수 있습니까? 그렇다면 어떻게해야합니까? – storen