잠재 용어 의미 분석 (LSA)을 배우고 있으며 용어 - 문서 행렬을 구성하고 SVD 분해를 찾을 수 있습니다. 분해에서 토픽을 얻으려면 어떻게해야합니까? gensim 예를 들어주제 찾기에서 잠재 의미 론적 분석
:
topiC#0(332.762): 0.425*"utc" + 0.299*"talk" + 0.293*"page" + 0.226*"article" + 0.224*"delete" + 0.216*"discussion" + 0.205*"deletion" + 0.198*"should" + 0.146*"debate" + 0.132*"be"
topiC#1(201.852): 0.282*"link" + 0.209*"he" + 0.145*"com" + 0.139*"his" + -0.137*"page" + -0.118*"delete" + 0.114*"blacklist" + -0.108*"deletion" + -0.105*"discussion" + 0.100*"diff"
topiC#2(191.991): -0.565*"link" + -0.241*"com" + -0.238*"blacklist" + -0.202*"diff" + -0.193*"additions" + -0.182*"users" + -0.158*"coibot" + -0.136*"user" + 0.133*"he" + -0.130*"resolves"
감사 Radim, gensim의 개발자. 내 질문을 바꿔 보자 : 정확하게 계수 0.425, 0.299 등의 의미는 무엇입니까? U, S, V에서 어떻게 계산하나요? –