나는 Gensim Support 포럼에서도 Google에 대한 연구를했지만 좋은 답변을 찾을 수 없습니다.Gensim Segmentation Fault
기본적으로,
내 샘플 코드에서 봐 주시기 바랍니다 내가 Gensim를 사용 Doc2Vec을위한 온라인 학습을 구현하고 있지만, Gensim 나에게 분할
"라는 임의의 오류를 던지는 유지 다음from gensim.models import Doc2Vec
from gensim.models.doc2vec import LabeledSentence
import random
import logging
if __name__ == "__main__":
logging.basicConfig(level=logging.INFO)
sentence1 = "this is a test"
sentence2 = "test test 123 test"
sentence3 = "qqq zzz"
sentence4 = "ppp"
sentences = [
LabeledSentence(sentence1.split(), ["p1"]),
LabeledSentence(sentence2.split(), ["p2"])
]
model = Doc2Vec(min_count=1, window=5, size=400, sample=1e-4, negative=5, workers=1)
model.build_vocab(sentences)
for a in range(2):
random.shuffle(sentences)
print([s.tags[0] for s in sentences])
model.train(sentences)
model.save("test.d2v")
new_model = Doc2Vec.load("test.d2v")
new_sentences = [
LabeledSentence(sentence1.split(), ["n1"]),
LabeledSentence(sentence3.split(), ["n2"])
]
new_model.build_vocab(new_sentences, update=True)
for a in range(4):
random.shuffle(new_sentences)
print([s.tags[0] for s in new_sentences])
new_model.train(new_sentences)
내 오류입니다
INFO:gensim.models.word2vec:training model with 1 workers on 7 vocabulary and 400 features, using sg=0 hs=0 sample=0.0001 negative=5 window=5
INFO:gensim.models.word2vec:expecting 2 sentences, matching count from corpus used for vocabulary survey
Segmentation fault
누군가가 나에게 설명 할 이유는 무엇입니까? 그리고이 문제를 해결하는 방법?
,감사합니다
OS, Python 또는 gensim에 문제가 있는지 어떻게 알 수 있습니까? 나는 Docker를 Python과 함께 사용하고있다 :이 코드를 실행하기위한 3 이미지 (내 질문 참조). –
이것들은 디버깅하기가 매우 어렵습니다. 그러나 최신 버전의 것들이 있으면 매우 드뭅니다. Docker 이미지의 OS/버전은 무엇입니까? 신선한 시작 (또는 모든 주요 패키지 제거/다시 설치)이 변경 되었습니까? gensim에서 예제를 실행하여 작동하는지 확인 했습니까? 이러한 단계를 수행하면 문제를 줄이는 방법이 있습니다. – gojomo