2016-09-13 11 views
0

doc2Vec 알고리즘을 빌드 할 때 여러 개의 임베딩이 필요합니다. 단어 벡터에는 embedding이 있고 동시에 문서 자체에는 embedding이 있습니다. 알고리즘이 작동하는 방식은 CBOW 모델과 비슷하지만, 주어진 윈도우로 트레이닝되는 각 문서마다 문서 임베딩이 사용됩니다. 그래서 우리가 5 개의 단어의 창을 가지고 있다면, 우리는 그 5 개의 단어를 계속 진행하지만, 각 창마다 우리는 문서를 삽입하는 벡터 자체를 항상 포함 시켜서 업데이트 할 수 있습니다.tensorflow에서 여러 임베딩의 조회 포함

답변

2

그냥 그들을 CONCAT :

input_tensor = tf.concat(1, [wordembedding_tensor, documentembedding_tensor]) 

그런 다음 입력-텐서가 입력됩니다.