필자가 아는 한, LDA 모델링을위한 주제는 Python/R에서 수정해야합니다. 그러나 결과는 다음과 같이 나타납니다. topic=10
문서, 9 개의 주제는 모두 '건강'에 관한 것이고이 문서에 대한 주제의 수는 실제로 2
입니다. 어떻게하면 각 주제의 키워드를 검토하지 않고도 실제로 구별되는 실제 주제를 직접 계산할 수 있습니까?Python/R에서 LDA 이후 고유 주제 수 찾기
P. 나는 인터넷 검색을했고 Theme에 의해 어휘 목록 (Word Banks)이 있다는 것을 배웠고 단어 목록에 따라 주제와 각 주제를 짝을 지을 수 있었다. 여러 주제가 동일한 주제에 속하면 하나의 주제로 결합 할 수 있습니다. 노력할만한 가치가있는 접근법이라고 생각합니다. 더 똑똑한 아이디어를 찾고 있습니다. 감사합니다.