word2vec 알고리즘을 사용하여 만든 두 가지 단어 벡터 모델이 있습니다. 지금 나는 직면하고있는 문제는 첫 번째 모델의 몇 마디가 두 번째 모델에 없다는 것입니다. 나는 단어 벡터의 의미와 맥락을 잃지 않고 두 모델의 단어 벡터를 사용할 수있는 두 가지 다른 단어 벡터 모델로 세 번째 모델을 만들고 싶습니다.다른 모델의 단어를 결합한 단어 벡터 모델 만들기
나는 이것을 할 수 있습니까? 그렇다면 어떻게 할 수 있습니까?
word2vec 알고리즘을 사용하여 만든 두 가지 단어 벡터 모델이 있습니다. 지금 나는 직면하고있는 문제는 첫 번째 모델의 몇 마디가 두 번째 모델에 없다는 것입니다. 나는 단어 벡터의 의미와 맥락을 잃지 않고 두 모델의 단어 벡터를 사용할 수있는 두 가지 다른 단어 벡터 모델로 세 번째 모델을 만들고 싶습니다.다른 모델의 단어를 결합한 단어 벡터 모델 만들기
나는 이것을 할 수 있습니까? 그렇다면 어떻게 할 수 있습니까?
번역 기능을 배우기 위해 다른 공유 단어를 사용하여 한 모델에서만 단어의 벡터를 다른 모델의 좌표 공간으로 잠재적으로 번역 할 수 있습니다.
최신 버전의 gensim에서는 이것을 수행 할 수있는 기능이 있습니다 (TranslationMatrix 도구 참조). Jupyter 노트북이 docs/notebooks
디렉토리에 포함 된 데모가있어, 볼 온라인 : 그것 때문에
https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/translation_matrix.ipynb
당신은 아마도 큰 모델을 것 (또는 둘 중 하나는 아마도, 더 나은 생각된다 더 많은 데이터에 대해 교육을 받음), 누락 된 단어의 수를 공간으로 변환합니다. 실제처럼 많은 공통 참조 '앵커'단어를 사용합니다.
그리고 귀하의 질문은 무엇입니까? – sophros