2017-01-02 9 views
1

신경망에 대한 입력으로 gensim word2vec를 사용하고 싶습니다. 나는 2 개의 질문이있다 :Gensim word2vec 출력은 무엇입니까

1) gensim.models.Word2Vec는 크기 매개 변수로 얻는다. 이 매개 변수는 어떻게 사용됩니까? 그리고 무엇의 크기?

2) 일단 gensim word2vec의 출력은 무엇입니까? 내가 볼 수 있듯이 이것은 확률 값이 아닙니다 (0과 1 사이가 아님). 우리는 각 단어 벡터에 대해이 단어와 다른 단어 사이에 거리 (코사인)를 표시합니다. (정확히 어떤 단어입니까?)

답장을 보내 주셔서 감사합니다. 1

답변

2

Ans By의 -이 기능 save_word2vec_format(fname="vectors.txt", fvocab=None, binary=False)ref를 이용한 단어 벡터를 저장할 수> -> 사이즈 파라미터 size=100

Ans By의 경우, 2 각 벡터 100 치수를 갖는 것이다 단어 벡터, 즉의 치수이다. 이렇게하면 "vectors.txt" 파일이 저장되며 첫 번째 행은 <size of the vocabulary> <dimensions>이고 나머지 행은 <word> <vector of size dimension> 형식입니다. "vectors.txt"에 대한

샘플 :

297820 100 
the -0.18542234751 0.138813291635 0.0392148854213 0.0238721499736 -0.0443151295365 0.03226302388 -0.168626211895 -0.17397777844 -0.0547546409461 0.166621666046 0.0534506882806 0.0774947957067 -0.180520283779 -0.0938140452702 -0.0354599008902 -0.0533488133527 -0.0667684564816 -0.0210904306995 -0.103069115604 -0.138712344952 -0.035142440978 -0.125067138202 0.0514192233164 -0.142052171747 0.0795726729387 0.0310433094806 -0.00666224898992 0.047268806263 0.0339849190176 -0.181107631029 0.0477396587205 0.0483130822899 -0.090229393762 0.0224528628225 0.190814060668 -0.179506639849 0.00034066604609 0.0639057478 0.156444383949 -0.0366888977431 -0.170674385275 -0.053907152935 0.106572313582 0.0724497821903 -0.00848717936216 0.124053494271 -0.0420715605081 0.0460277422205 -0.0514693485657 0.132215091575 -0.0429308836475 -0.111784875385 -0.0543172053216 0.0849476776796 -0.015301892652 0.00992711997251 -0.00566113637219 0.00136359242972 -0.0382116842516 0.0681229985191 0.0685156463052 0.0759072640845 -0.0238136705161 0.168710450161 0.00879930186352 -0.179756801973 -0.210286559709 -0.161832152064 -0.0212640125813 -0.0115905356526 -0.0949562511822 0.126493155131 0.0215821686774 -0.164276918273 -0.0573806470616 -0.0147266125919 0.0566350339785 -0.0276969849679 0.0178970346094 0.0599163813161 0.0919867942845 0.172071394538 0.0714226787026 0.109037733251 0.00403647493576 0.044853743905 -0.0915639785243 -0.0242494817113 0.0705554654776 0.255584701079 0.001309754199 0.0872413719572 -0.0376289782286 0.158184379871 0.109245196088 -0.0727554069742 0.168820215174 0.0454895919746 0.0741726055733 -0.134467710995 
... 
...