저는 TensorFlow 튜토리얼을 사용하여 Word2Vec에 대해 배우고 있습니다. Word2Vec에 대해 실행중인 코드는 TensorFlow 자습서 (https://github.com/tensorflow/models/blob/master/tutorials/embedding/word2vec_optimized.py)에서도 제공됩니다. 15 개 에포크의 코드를 실행했을 때 테스트 정확도는 약 30 %였습니다. 100 개의 신기원을 실행했을 때, 테스트 정확도는 약 39 %까지 올라갔습니다. 저는 교육을 위해 Text8 데이터 세트를 사용하고 평가를 위해 words.txt를 사용하고 있습니다.Word2Vec 교육 일정은 얼마나됩니까? 권장 교육 데이터 세트 란 무엇입니까?
더 많은 신기원을 실행해야합니까? 다른 데이터 세트를 사용해야합니까? 테스트 정확도를 어떻게 향상시킬 수 있습니까?
고마워요! 나는 더 큰 데이터 세트를 시도 할 것이다. –
큰 데이터 세트는 테스트 정확도를 높였습니다. 데이터 세트와 테스트를 주제 자료와 일치시키는 것이 좋습니다. –