모국어를 위해 사전에 훈련 된 word2vec 모델을 다운로드했습니다. 은 그것은 "news.model.bin"파일을했고, 내가 그것을 압축을 풀 때, txt
파일이나 pickle
를 볼 것으로 예상,하지만 난 이런 혼란 consistat으로 다른 .bin
파일을 발견Theano 또는 TensorFlow에 ".bin"로드하기
\09\b9\.,-;sdfkf %some really strange symbols and seem to be invalid symbols%
I 파일을 정상적으로 열 수 없기 때문에 복사 할 수 없습니다. 무거워서 노트북이 죽을뿐입니다. 질문 :이 예시 코드는 사전 전차 모델 일 수 있습니까? 그렇다면 어떻게 처리해야합니까?
P. 난에서 모델 얻었다 링크 (모델 페이지의 하단에 있습니다) : http://ling.go.mail.ru/dsm/ru/about
빠른 구글 온 [이 (http://mccormickml.com/2016/04/12/googles-pretrained-word2vec- 모델 -에서 - 파이썬 /). Word2vec의 특수 형식이라고 생각합니다. 희망이 도움이됩니다. – Kh40tiK
[word2vec bin 파일을 텍스트로 변환] 가능한 복제본 (http://stackoverflow.com/questions/27324292/convert-word2vec-bin-file-to-text) –