0
기차 데이터에서 word2vec을 학습하지만 기차 데이터에없는 테스트 데이터의 일부 단어가 있기 때문에 원본과 같은 데이터 분포 나 숫자 범위와 일치하는 단어 벡터를 어떻게 만들 수 있습니까?unknow word에 대해 임의의 word2vec 벡터를 얻는 방법은 무엇입니까?
기차 데이터에서 word2vec을 학습하지만 기차 데이터에없는 테스트 데이터의 일부 단어가 있기 때문에 원본과 같은 데이터 분포 나 숫자 범위와 일치하는 단어 벡터를 어떻게 만들 수 있습니까?unknow word에 대해 임의의 word2vec 벡터를 얻는 방법은 무엇입니까?
어휘의 빈번하지 않은 단어 목록을 가져 와서 알 수없는 단어에 대한 대략적인 단어 벡터를 얻을 수 있습니다.
또는
의 타겟 알 수없는 단어가 w
이고 그것의 컨텍스트 내에서 c-2 c-1 w c1 c2
곳 c-2
, c-1
, c1
및 c2
상황에 맞는 단어 가정 해 봅시다