2017-05-16 6 views
0

다음 word2vec 모델로드에서 사용하려는 단어를 목록에서 필터링한다고 가정합니다. 어떻게 필터링 된 단어 목록 만 포함하는 자체 KeyedVectors를 구성 할 수 있습니까? 일부 단어를 필터링하여 Gensim Word2vec 모델의 속도를 높이려면 어떻게해야합니까?

내가 만들려고 : 주어진 단어에 대한

w2v_model_keyed = w2v_model.wv 
w2v_model_keyed.drop(word) 

그러나 나는 다음과 같은 오류 얻을 :

AttributeError: 'KeyedVectors' object has no attribute 'drop' 

당신이

답변

0

gensim KeyedVectors 클래스는 점진적 확장을 지원하지 않습니다 감사를 또는 변경 (예 : .drop() 메서드 사용). 원하는 크기/내용의 새 인스턴스를 만들어야합니다.

gensim KeyedVectors source code, 특히 .load_word2vec_format() method을 보면 기존 인스턴스가 gensim으로 작성된 방법을 배우고 필요한 크기/단어 만 생성하는 방법을 모방해야합니다.