Word2vec는 Google에서 제공하는 단어 거리를 계산하는 오픈 소스 도구입니다. 단어를 입력하고 유사성에 따라 순위가 매겨진 단어 목록을 출력하여 사용할 수 있습니다. 예 :2 단어를 제공하여 유사 거리를 계산하는 방법을 word2vec를 사용하는 방법
입력 :
france
출력 :
Word Cosine distance
spain 0.678515
belgium 0.665923
netherlands 0.652428
italy 0.633130
switzerland 0.622323
luxembourg 0.610033
portugal 0.577154
russia 0.571507
germany 0.563291
catalonia 0.534176
그러나, 제가해야 할 것은이 개 단어를 제공함으로써 유사성 거리를 계산하는 것입니다. 내가 '프랑스'와 '스페인'을 주면, '프랑스'라고 말하면서 전체 단어 목록을 읽지 않고 어떻게 점수 0.678515를 얻을 수 있습니까?
이 컨텍스트에서 도움이되는 경우 [여기] (http://radimrehurek.com/gensim/models/word2vec.html) 원본 word2vec C 언어 구현으로 생성 된 벡터 파일 사용. – matanster
@Satarupa Guha :이 유사성은 무엇입니까? 그것은 코사인인가? –
예, 실제로는 코사인 유사성 함수입니다. –