gensim

1열

1답변

나는 this 튜토리얼을 따라 모든 것이 내가 사전 처리 및 내 모델을 학습하지만, 괜찮 나는 다음 코드를 사용하여 유사성을 발견 할 때 model = gensim.models.Word2Vec.load("wiki.fa.word2vec.model") print model.most_similar(U'ماه') 벡터에없는을 올바른 형식 : [(u'\u063

1열

1답변

Doc2Vec에 사용 된 단어를 추출하는 방법

트윗을 사용하여 Doc2Vec 모델을 준비 중입니다. 각 트윗의 단어 배열은? 어떻게. "SENT_2을" taggeddocs = [] for index,i in enumerate(cleaned_tweets): if len(i) > 2: # Non empty tweets sentence = TaggedDocument(words=gen

1열

1답변

doc2vec의 파이썬 간단한 구현?

gensim에서 doc2vec를 구현하려고하지만 일부 오류가 있거나 웹에서 설명서 나 도움말이 충분하지 않습니다. 여기 내 작업 코드의 일부입니다 from gensim.models import Doc2Vec from gensim.models.doc2vec import LabeledSentence class LabeledLineSentence(objec

2열

1답변

python gensim doc2vec에서 원본 문장 검색 taggedlinedocument

Gensim의 doc2vec 방법을 사용하여 한 줄에 한 문장 씩 들어있는 텍스트 파일을 읽습니다. 그것은 키가 토큰 화 된 용어 목록이고 값이 문장 번호 인 사전으로 파일을 읽습니다. 새 파일의 from gensim import utils from gensim.models.doc2vec import LabeledSentence,TaggedLine

2열

1답변

gensim LDA 모듈 : 예측 중에 균일 한 주제별 분포가 항상 발생합니다

문서 세트가 있고 각 문서의 주제 분포를 알고 싶습니다 (항목 수의 값이 다른 경우). 나는 this question에서 장난감 프로그램을 가져 갔다. 나는 gensim에서 제공 한 LDA를 처음 사용했으며, 테스트 데이터를 교육 데이터 자체로 제공하여 교육 데이터에서 각 문서의 주제 배포를 얻었습니다. 하지만 항상 주제별 분포가 균일 해지고 있습니다. 여

13열

2답변

어떻게 내가이 논문 <a href="http://cs.stanford.edu/~quocle/paragraph_vector.pdf">http://cs.stanford.edu/~quocle/paragraph_vector.pdf</a></p> <p>thorugh려고하고 doc2vec 단락 벡터

을 계산 gensim 수행하고 그것은 "Theparagraph 벡터와 단어 벡터 맥락에서 다음 단어를 예측하는 평균 또는 을 연결됩니다한다고 실험에서는 벡터를 결합하는 방법으로 연결을 사용합니다. " 어떻게 연결 또는 평균화가 작동합니까? (제 1 단어 1 및 word2 포함될 경우) 예 : 이미지에서도 word1 vector =[0.1,0.2,0.3]

12열

3답변

gensim word2vec 입/출력 벡터에 액세스

word2vec 모델에는 vocab 공간에서 단어를 숨겨진 레이어 ("in"벡터)로 가져간 다음 vocab 공간으로 되돌아가는 두 개의 선형 변환이 있습니다 ("out "벡터). 보통이 아웃 벡터는 훈련 후에 폐기됩니다. gensim python에서 벡터를 액세스하는 쉬운 방법이 있는지 궁금합니다. 동등하게, 어떻게 행렬에 액세스 할 수 있습니까? 동기 부

0열

1답변

워드 벡터 및 단락 벡터 쿼리

Gensim의 구현에서 word2vec와 doc2vec 벡터 간의 관계를 이해하려고합니다. 내 응용 프로그램에서 동일한 레이블 (주제)로 여러 문서에 태그를 달기 위해 dbow_words = 1을 사용하여 내 코퍼스에서 doc2vec 모델을 학습하여 단어 벡터도 조정합니다. 나는이 의미에서 많은 의미를 지닌 단어와 문서 벡터 사이의 유사점을 얻을 수 있었다

1열

1답변

SKlearn LDL 대 Gensim LDA의 복잡성 비교 문제

나는 sklearn과 gensim을 모두 사용하여 lda를 적용했습니다. 그런 다음 보관 된 데이터의 혼란을 확인했습니다. 나는 sklearn에 대한 perplexy의 gensim과 positive 값의 혼란에 대해 부정적인 값을 얻고 있습니다. 그 값들을 어떻게 비교합니까? 당신이 np.exp(-1. * gensim_model.log_perplexity(

1열

1답변

Doc2Vec Gensim 문서와 주제 사이의 유사성

저는 Gensim을 처음 사용 해보고 있으며 지금 질문이 있습니다. 준비된 문서 모음으로 LSI 모델을 교육했습니다. 내 질문은 새 문서가 문서 모음에서 생성 된 모델과 유사한 지 어떻게 알 수 있습니까? MatrixSimilarity처럼 내 코퍼스의 각 문서에 대한 문서의 유사성을 알고 싶지는 않지만 문서가 내 주제/모델과 유사한지를 아는 것이 좋습니다.