2017-01-18 7 views
1

Python으로 구현 된 Doc2Vec 모델의 정확성을 얻고 싶습니다. 공식 문서에서 매개 변수로 파일을 취하는 정확성을 얻는 방법이 있다는 것을 알았습니다. 입력 파일의 내용은 무엇이되어야합니까?Python에서 word2vec 모델의 정확도를 계산하십시오.

문서에서 말한 것처럼 4 중 튜플을 넣으려고했으나 모든 패턴이 잘못 분류되었습니다.

답변

0

Doc2Vec 모델의 정확성에 대한 간단한 측정은 없습니다. 귀하의 코퍼스 및 프로젝트 목표에 맞는 평가 방법이 필요합니다.

또한 Doc2Vec에서 상속받은 Word2Vec의 accuracy() 메서드는 원래의 word2vec 문서와 원래의 Google word2vec.c 도구 키트에서 동일한 메서드가 사용 되었기 때문에 단어 벡터 만 사용하는 매우 좁은 종류의 유추 테스트를 수행합니다. 사용 된 테스트 파일은 questions-words.txt이고 questions-phrases.txtGithub mirror of the Google word2vec-toolkit입니다.

일부 Doc2Vec 모드는 워드 벡터를 생성하므로 이러한 Doc2Vec 모델에 대해 이와 같은 유추 테스트를 수행 할 수 있습니다. 그러나 문서 벡터를 전혀 검사하지는 않으며 해당 단어 유사도가 좋은 모델 다운 스트림 문서 작업이 무엇이든간에 최선이 아닐 수도 있습니다.