내 용어 - 문서 행렬은 numpy 행렬 형식이며, 용어 - 문서 행렬을 나타내는 사전이 있습니다.Gensim LDA 모델에 용어 - 문서 행렬 전달
Gensim의 LDA 모델에이 두 가지를 쉽게 전달할 수있는 방법이 있습니까?
tdMatrix = np.load('tdmatrix.npy')
dictionary = cPickle.load(open('dictionary.p', 'r')) # stores term represented by each column
어떻게 든 gensim.models.ldamodel.LDA로 전달할 수 있습니까?
예상되는 형식과 관련된 모든 문서가 있습니까? 예를 들어, 약 18GB의 디스크에 저장된 희소 csc 행렬이 있습니다. 컬럼은 다른 용어이며, 행은 주어진 용어에 대해 0이 아닌 계수가있는. 서입니다. "* 2Corpus"함수는 csc 수락을 설명하지만 문서가 열 차원이거나 열 차원이어야하는 경우 명확하지 않습니다. – ely