2013-10-27 3 views
2

Gensim을 사용하여 LDA 주제 모델링을 실험했습니다. Gensim에서 어떤 주제 모델 평가 도구를 찾을 수 없었습니다. 보류 된 평가 텍스트에 대한 주제 모델의 난이도를보고함으로써 LDA 매개 변수 (예 : 주제 수)의 미세 조정을 용이하게합니다. Gensim에서 주제 모델 평가를 수행 할 수있는 방법에 대해 누구나 밝힐 수 있다면 크게 감사하겠습니다. 이 질문은 metaoptimize에도 게시되었습니다.Gensim의 주제 모델 평가

답변

1

gensim mailing list에서 answer을 찾았습니다.

즉, LdaModel의 bound() 메서드는 보류 된 코퍼스를 기반으로 복잡성의 하한값을 계산합니다.

+5

gensim 0.8.9부터는 'model.log_perplexity (heldout)'을 사용할 수도 있습니다. 이는 편의성 래퍼입니다. – Radim