저는 신경망을 훈련시키고 벡터 공간에 유사한 단어를 찾는 신경 내장을 구축하기 위해 word2vec 모델을 사용하고 있습니다. 하지만 제 질문은 단어 및 컨텍스트 삽입 (행렬)의 차원에 대한 것이며,이 경우 처음에 임의의 숫자 (벡터)로 시작합니다. https://iksinc.wordpress.com/2015/04/13/words-as-vectors/Word2Vec의 치수는 어디에서 가져 왔습니까?
{book, paper , 노트북, 소설} 그래프의 단어, 우선 우리는이 차원이 4x2 또는 4x3 또는 4x4 등인 행렬을 작성해야합니다. 행렬의 첫 번째 차원은 우리의 어휘 크기 | v |를 알고 있습니다. 그러나 행렬의 두 번째 차원 (벡터의 차원 수)은 "book"[0.3,0.01,0.04] 단어의 벡터입니다.이 숫자는 무엇을 의미합니까? 예를 들어 0.3과 관련된 숫자 어휘에서 단어 "책"과 "종이"사이의 관계에 0.01은 책과 수첩 등의 관계입니다. 각 차원 (열) Y가 의미하는 TF-IDF 또는 Co-Occurence 행렬과 마찬가지로 - 행 X의 단어와 관련된 단어 또는 문서
흥미로운 질문이 많습니다. – Aaron