나는 문장의 600,000 행에 대해 doc2vec하려이며 내 코드는 다음과 같습니다 :Doc2vec : model.docvecs는 길이 10
model = gensim.models.doc2vec.Doc2Vec(size= 100, min_count = 5,window=4, iter = 50, workers=cores)
model.build_vocab(res)
model.train(res, total_examples=model.corpus_count, epochs=model.iter)
#len(res) = 663406
#length of unique words 15581
print(len(model.wv.vocab))
#length of doc vectors is 10
len(model.docvecs)
# each of length 100
len(model.docvecs[1])
가 어떻게이 결과를 해석합니까? 이유는 벡터의 길이가 각각 10인데 크기가 10 인 이유는 무엇입니까? 'res'의 길이가 663406이면 의미가 없습니다. 나는 여기서 뭔가 잘못 알고있다.
Understanding the output of Doc2Vec from Gensim package에서 docvec의 길이는 명확하지 않은 '크기'로 결정됩니다.