doc2vec

    1

    1답변

    현재 doc2vec 코드는 다음과 같습니다. # Train doc2vec model model = doc2vec.Doc2Vec(docs, size = 100, window = 300, min_count = 1, workers = 4, iter = 20) 다음과 같이 word2vec 코드도 있습니다. # Train word2vec model model

    0

    1답변

    크기가 100 크기 인 doc2vec 모델을 만들었습니다. 저의 독서에서 알 수 있듯이이 치수는 제 모델의 특징입니다. 이 치수가 정확히 무엇인지 어떻게 확인할 수 있습니까?

    0

    1답변

    그래서 2000 개의 보고서가 있으며 각 보고서에는 문제에 대한 간단한 설명이 있습니다. 내 목표는 이러한 모든 것을 클러스터링하여 이러한 보고서에서 뚜렷한 추세를 찾을 수있게하는 것입니다. 나는 일종의 문맥 텍스트 벡터를 사용하고 싶습니다. 자, Word2Vec을 사용하고 이것이 좋은 옵션이 될 것이라고 생각하지만, 역시 Doc2Vec과 나는이 유스 케이

    0

    1답변

    나는 많은 반복이있는 텍스트로 작업하려고합니다. SKLearn에서 전에 tf-idf 벡터 라이저를 사용했으며 파라미터는 max_df=0.5입니다. 즉, 단어가 입력의 50 %보다 많으면 단어가 사용되지 않습니다. Python에서 비슷한 기능이 있는지, 아니면 Doc2Vec 또는 NLTK인지 알고 싶습니다. 데이터 집합을 벡터화하지 않고 데이터 집합의 50

    1

    1답변

    내 문서의 고유 식별자로 Doc2Vec 태그를 사용하고 있습니다. 각 문서는 다른 태그를 가지고 의미 론적 의미가 없습니다. 태그를 사용하여 특정 문서를 찾았으므로 이들 간의 유사성을 계산할 수 있습니다. 태그가 내 모델의 결과에 영향을 줍니까? 이 tutorial에서는 매개 변수 train_lbls=false에 대해 이야기하고 있으며이 값을 false로

    0

    1답변

    pkl 파일에서 doc2vec 모델을로드하면이 오류가 발생합니다. --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-45-5ed9dc71f3a6

    0

    1답변

    Doc2Vec을 처음 사용했습니다. 저자의 작품을 분류하려고합니다. 나는 레이블이 달린 문장 (단락 또는 지정된 길이의 문자열)이있는 모델을 훈련 시켰는데, words = 단락의 단어 목록과 tags = 저자의 이름입니다. 제 경우에는 두 명의 작가 만 있습니다. 훈련 된 모델에서 docvecs 특성에 액세스를 시도했지만 모델을 교육 할 때 두 태그에 해당

    0

    1답변

    나는 doc2Vec 및 word2Vec에 대해 읽으려는 수많은 문서를 읽었습니다. 단어를 벡터로 표현하고 벡터 추가, 빼기와 같은 간단한 작업을 수행하여 단어 사이에 의미있는 비유를 산출하는 것이 얼마나 강력한 지 이해합니다. 비록 내가 아직 이해할 수없는 한 가지는이 기술이 사용자 감정을 이해하는 데 어떻게 사용될 수 있는지입니다. 누군가가 이러한 기술을

    0

    1답변

    OS X의 Jupyter 노트북에서 doc2vec 모델을 학습 할 때 다음 오류가 발생합니다. 현재 데이터 세트에 대한 오류가 재현 가능하지만 변경 사항이 발생하는 특정 스레드가 변경됩니다. , 비록 다른 데이터 세트에서 성공적으로 모델을 훈련 시켰지만. Exception in thread Thread-82: Traceback (most recent ca

    1

    1답변

    나는이 page을 읽었지만 다음 코드를 기반으로 만들어진 모델 간에는 어떤 차이가 있는지 이해하지 못합니다. dbow_words가 0 일 때 doc-vectors에 대한 학습이 빠릅니다. 첫 번째 모델 model = doc2vec.Doc2Vec(documents1, size = 100, window = 300, min_count = 10, workers=4