을 계산 gensim 수행하고 그것은어떻게 내가이 논문 <a href="http://cs.stanford.edu/~quocle/paragraph_vector.pdf">http://cs.stanford.edu/~quocle/paragraph_vector.pdf</a></p> <p>thorugh려고하고 doc2vec 단락 벡터
"Theparagraph 벡터와 단어 벡터 맥락에서 다음 단어를 예측하는 평균 또는 을 연결됩니다한다고 실험에서는 벡터를 결합하는 방법으로 연결을 사용합니다. "
어떻게 연결 또는 평균화가 작동합니까? (제 1 단어 1 및 word2 포함될 경우)
예 : 이미지에서도
word1 vector =[0.1,0.2,0.3]
word2 vector =[0.4,0.5,0.6]
concat method
does paragraph vector = [0.1+0.4,0.2+0.5,0.3+0.6] ?
Average method
does paragraph vector = [(0.1+0.4)/2,(0.2+0.5)/2,(0.3+0.6)/2] ?
는 :
단락 토큰으로 간주 할 수
는 것을 주장한다 다른 단어. 현재 문맥에서 누락 된 것을 기억하는 메모리로 작동하거나 단락의 주제를 으로 기억합니다. 이러한 이유로 우리는 종종이 모델을 단락 벡터 (PV-DM)의 분산 메모리 모델 이라고 부릅니다.
단락 토큰이 on
과 동일한 단락 벡터입니까?