2017-02-13 11 views
1

Word2Vec과 매우 유사한 FastText 인 https://pypi.python.org/pypi/fasttext을 가지고 놀고 있습니다. 이후 아직 많은 기능을 내장하지 않은 꽤 새로운 라이브러리 인 것 같습니다. 나는 형태학 비슷한 단어를 추출하는 방법을 궁금해했다. 예를 들면 : model.similar_word ("dog") -> dogs. 그러나 내장 된 기능은 없습니다.FastText로 비슷한 단어를 찾는 방법은 무엇입니까?

모델 [ "dog"]을 입력하면 코사인 유사성을 비교하는 데 사용할 수있는 벡터 만 얻을 수 있습니다. model.cosine_similarity (model [ "dog"], model [ "dogs"]]. 루프의 일종을하고 텍스트에서 모든 가능한 쌍 cosine_similarity을 그 시간이 걸릴 것입니다 ..

답변

7

사용 gensim을, load.word2vec 모델로 fastText 훈련 된 .vec 파일을로드하고 most_similiar() 메서드를 사용하여 유사한 단어를 찾습니다.

2

당신은 model.vec를로드 gensim를 사용하고 유사한 단어 얻어야한다 :

m = gensim.models.Word2Vec.load_word2vec_format('model.vec') 
m.most_similar(...)