코드는 Python 형식입니다. 나는 파이썬에서 gensim에 바이너리 모델을로드했다. &은 "init_sims"옵션을 사용하여 실행 속도를 높이었다. OS는 OS X입니다. 로드하는 데는 거의 50-60 초가 걸립니다. 그리고 가장 동등한 시간은 "most_similar"를 찾아야합니다. 이게 정상인가? init_sims 옵션을 사용하기 전에 거의 두 배의 시간이 걸렸습니다! OS RAM 할당 문제 일 수 있다고 생각합니다. 항상 절약 (단위 정규화 벡터를 다시 계산 될 수있는)를 '원시'벡터를 저장하기 때문에 init_sims(replace=True)
의 메모리 절약 효과, 저장 /로드 사이클 지속되지 않는Word2Vec : Gensim 및 Google-News 데이터 세트 사용 - 매우 느린 실행 시간
model=Word2Vec.load_word2vec_format('GoogleNewsvectorsnegative300.bin',binary=True)
model.init_sims(replace=True)
model.save('SmallerFile')
#MODEL SAVED INTO SMALLERFILE & NEXT LOAD FROM IT
model=Word2Vec.load('SmallerFile',mmap='r')
#GIVE RESULT SER!
print model.most_similar(positive=['woman', 'king'], negative=['man'])
훈련시 cbow와 ngram을 전환 해보십시오. – AbtPst