0

패턴과 물건을 찾는 벡터를 분석하고 SVM을 사용하여 클래스 A와 B 사이의 분류 작업을 완료하려면 작업을 감독해야합니다. 이상하게 들릴지 모르지만 숙제 일 수 있습니다. 결과적으로 내가 알아야 할 내용은 다음과 같습니다.gensim의 word2vec에서 어휘 벡터를 추출하는 방법은 무엇입니까?

훈련 된 모델을 사용하여 문서의 코드화 된 벡터를 추출하는 방법은 무엇입니까?

2 개를 해석하는 방법과 word2vec에서 코드를 어떻게 작성합니까?

저는 gensim의 word2vec를 사용하고 있습니다. 당신이 모델을 word2vec 훈련을 한 경우

+1

전체 문서를 분류하려면 gensim 라이브러리에서도 사용할 수있는 Doc2Vec 모델을 확인해야합니다. (조금 오래된 구식) 자습서는 https://rare-technologies.com/doc2vec-tutorial/에 있으며 최신 버전으로 내 대답을 확인하십시오. http://stackoverflow.com/questions/ 31321209/doc2vec-how-to-get-document-vectors/39329194 # 39329194 –

답변

1
  1. , 당신은 __getitem__ 방법으로 단어 벡터를 얻을 수

    model = gensim.models.Word2Vec(sentences) print(model["some_word_from_dictionary"])

  2. 불행하게도에서 묻어 word2vec/doc2vec 주제는 달리 사람 (에 의해 해석되지 LdaModel의 벡터)

P/S 작업의 개체에 텍스트가있는 경우 Doc2Vec mod를 사용해야합니다. el