현재 doc2vec 코드는 다음과 같습니다.부정 샘플링이 포함 된 Doc2vec 및 word2vec
# Train doc2vec model
model = doc2vec.Doc2Vec(docs, size = 100, window = 300, min_count = 1, workers = 4, iter = 20)
다음과 같이 word2vec 코드도 있습니다.
# Train word2vec model
model = word2vec.Word2Vec(sentences, size=300, sample = 1e-3, sg=1, iter = 20)
나는 doc2vec 모두 DM 및 DBOW 사용에 관심과 word2vec에서 건너 뛰기 그램과 CBOW 모두. , 내가 이렇게
"계층이 softmax 또는 음의 샘플링을 사용하여," "word2vec의를 통해 깊은 학습과 제작 워드 벡터"건너 뛰기 g 및 CBOW 모델 : Gensim에서
은 내가 아래에 언급 된 문장을 발견 계층 적 softmax 또는 음의 샘플링을 혼란스럽게합니다. 이 두 가지 방법에서 차이점이 무엇인지 알려주세요.또한, 내가 필요로하는 매개 변수가 계층 softmax를 및/또는 DM, DBOW에 대한 부정적인 샘플링를 사용하는을 변경할 수있는 것을 을 아는에 관심이 있어요, 건너 뛰기 그램과 CBOW를?
p.s. 내 응용 프로그램은 추천 시스템입니다.
대단히 감사합니다. 아주 잘 설명되어 있습니다. 이것은 내가 찾고 있었던 바로 그 것이다. 다시 한 번 감사드립니다 :) –
답변을 알고 계시면 알려 주시기 바랍니다. https://stackoverflow.com/questions/46970376/issues-in-gensim-wordrank-embeddings –