2017-12-21 32 views
0

doc2vec 모델을 교육 한 후에 다른 모듈의 문서 벡터를 다시 사용하고 싶습니다. 이것을 구현하는 방법은 두 가지 인 것 같습니다 : 및 doc-vectors를 사전으로 저장하여 을 저장하십시오. 나는 어느 쪽이 메모리 효율이 더 좋고 대상 모듈에서 더 빨리 읽힐 까?어떤 방법으로 doc2vec 모델을보다 효율적으로 복구 할 수 있습니까?

+0

벤치 마크 결과를 게시하십시오. 첫 번째와 두 번째 방법이 환경에서 몇 초가 걸렸습니까? –

+0

그건 당신이 사용하고있는 라이브러리와 공개하지 않은 코드의 다른 선택에 달려 있습니다. @J_H가 암시 하듯이 두 가지 접근법을 시도하고 타이밍을 비교하십시오. (그리고 또한 디스크의 크기와 명백한 RAM 사용량 등) – gojomo

+0

감사합니다. 몇 가지 실험을 한 후에, 나는이 두 가지 방법 사이에 큰 차이가 없다는 것을 발견했다. (최소한 나의 데이터 세트에서는). – YangGuo

답변

0

성능 측정이 중요합니다. 흥미로운 수의 데이터 세트의 경우 두 가지 절약 방법이 비슷한 시간이 걸릴 것입니다.