gensim

    3

    2답변

    gensim 라이브러리에서 생성 한 word2vec를 시각화하고 싶습니다. 나는 sklearn을 시도했으나 그것을 얻으려면 개발자 버전을 설치해야 할 것 같습니다. 개발자 버전을 설치하려고했지만 내 컴퓨터에서 작동하지 않습니다. 이 코드를 수정하여 word2vec 모델을 시각화 할 수 있습니까? tsne_python

    1

    1답변

    주제 모델링을 처음 사용했습니다. 내 목표는 문서에서 주요 주제를 찾는 것입니다. 나는 목적을 위해 lda를 사용할 계획이다. 그러나 lda에서는 주제의 수가 미리 정의되어야합니다. 훈련 자료에없는 다른 도메인의 문서가 오면 올바른 결과를 얻지 못할 것이라고 생각합니다. 다른 해결책이 있습니까? 내 생각이 맞습니까?

    0

    1답변

    내 질문은이 게시물과 관련이 있습니다 Document topical distribution in Gensim LDA, gensim.models.ldamodel에 대한 설명서는 "minimum_probability는 문서 (활)에 대해 반환 된 주제를 필터링 제어합니다." 그러나 ldamodel [corpus]는 확률이 가능한 모든 주제를 반환합니다 (min

    0

    1답변

    작은 크기의 lp를 계산할 때 파이썬에서이 오류가 발생하지만 다른 경우에는 정상적으로 작동합니다. 신체의 크기는 15 내가 5 항목의 수를 설정하는 시도는 2로 감소하지만 여전히 같은 오류가 있습니다 : 에 ValueError : 하늘의 콜렉션을 통해 LDA를 계산할 수 없다 (NO 용어) 을 이 라인에서 오류가 : lda = models.LdaModel(

    4

    2답변

    # -*- coding: utf-8 -*- ''' 한국어 형태 분석된 자료를 word2Vec모델로 만드는 모듈 입력은 형태분석된 파일을 취함 한 줄에 한 문장씩 출력으로 model을 형성 ''' import codecs import gensim import multiprocessing import word2vec import sys

    1

    1답변

    저는 Word2Vec 모델을 학습하는 데 gensim을 사용했으며 가까운 용어를 쿼리하려고합니다. 그러나 단지 모든 방향으로 가장 가까운 단어 얻는 대신 : model = models.Word2Vec.load('MyModel') # load up my trained model nearest = model.most_similar(['mushroom'])

    1

    1답변

    큰 자료 위에 구문 모델을 작성하려고하지만 메모리 오류가 발생합니다. 먼저 큰 소리 내 전체 모음집에 맞추려고했습니다. 이러한 솔루션 작업 import codecs import gensim import os import random import string import sys def gencorp(file_path): with code

    0

    1답변

    내 gensim Word2Vec 모델의 단어를 매핑으로 바꾸고 싶습니다. 예 나의 현재 모델은 벡터에 매핑되는 단어 'foo'이 : 어떻게이 새로운와 모델을 재 구축 할 수 있습니다 d = {'foo': 'bar', ...} : >>> model['foo'] [1.0 0.0] 나는 매핑이를 그러한 매핑은 >>> model['bar'] # in plac

    0

    1답변

    텍스트 데이터에 대해 다중 레이블 분류를 실행했습니다. TFIDF가 LDA보다 월등히 뛰어났습니다. TFIDF 정확도는 50 %, LDA는 29 %였다. 이것은 예상 되었습니까, 아니면 LDA가 이보다 나은가요?

    0

    1답변

    나는 geinsim에서 300 치수로 훈련 된 word2vec 모델을 가지고 있으며 치수를 100으로 자르고 싶습니다 (단순히 지난 200 치수를 버리십시오). 파이썬을 사용하는 가장 쉽고 효율적인 방법은 무엇입니까?