word2vec

    0

    1답변

    나는 파이썬에서 gensim 라이브러리에 구현 된 word2vec 모델을 적용하려고합니다. 나는 문장의 목록을 가지고있다. (각 문장은 단어의 목록이다.) sentences=[['first','second','third','fourth']]*n 을 나는 두 개의 동일한 모델 구현 : 예를 들어 우리가 보자 내가 모델이 때로는 동일하고, 때로는 값에 따라

    0

    2답변

    word2vec에서 사전의 단어를 N 차원 공간의 좌표에 매핑하는 것이 일반적입니다. 이 과정을 거꾸로하고 공간의 어떤 위치에서 주어진 단어를 합성 할 수있는 방법이 있습니까?

    7

    1답변

    gensim.models.Word2Vec 라이브러리를 사용하면 가장 유사한 단어 목록을 찾고자하는 모델과 "단어"를 제공 할 수 있습니다 : model = gensim.models.Word2Vec.load_word2vec_format(model_file, binary=True) model.most_similar(positive=[WORD], topn=N)

    49

    2답변

    아래의 논문을 읽고 있는데 부정적인 샘플링의 개념을 이해하는 데 몇 가지 문제가 있습니다. http://arxiv.org/pdf/1402.3722v1.pdf 는 누구의 도움을 주시겠습니까?

    0

    1답변

    이 내 팬더 ​​데이터 프레임이 같은 같습니다 Movieid review movieRating wordEmbeddingVector 1 "text" 4 [100 dimensional vector] 나는 doc2vec 구현을 실행하려고하고 내가 영화 IDS에 의해 그룹에 수 있어야합니다 및 는 wordEmbeddingVector의 벡터의 합을 타고

    -2

    1답변

    나는 다양한 단어 길이의 약 100000 개의 문서를 가지고있다. 나는 또한 전체 자료에 word2vec 모델을 훈련시켰다. 이제이 단어 벡터를 사용하지 않고 각 개별 문서에 대해 동일한 차원의 지형지 물을 생성하려면 어떻게해야합니까? 나는이 작업을 수행하는 방법에 대해 알고 있는데, 하나는 문서의 모든 단어에 대한 벡터의 평균을 취하고 다른 하나는 k-m

    4

    1답변

    gensim 0.11.1 버전의 Doc2Vec에서 보이지 않는 문서의 벡터를 가져 오는 방법이 있습니까? 예를 들어, 내가 백만에 모델을 훈련 가정 - 나는 그 1000 개 문서에 대한 의 DoC 벡터받을 수 있습니까? 보이지 않는 문서의 문서 벡터를 얻으려면 같은 어휘에서 가져온 방법이 있습니까? 첫 번째 글 머리를 들어

    7

    2답변

    두 단어 유사성 (다운 스트림 작업을위한 동의어 추출의 일부로)을 수행하려고하는 약 11,000,000 개의 토큰의 데이터 세트로 Word2Vec을 사용하고 있는데, 얼마나 많은 차원을 갖고 있는지 잘 모르겠습니다. Word2Vec과 함께 사용해야합니다. 토큰/문장의 수에 따라 고려해야 할 차원의 범위에 대해 훌륭한 경험을 가진 사람이 있습니까?

    21

    2답변

    현재 문맥을 기반으로 단어를 벡터로 표현하기 위해 word2vec 신경망 학습 알고리즘의 구조를 이해하려고합니다. Tomas Mikolov paper을 읽은 후 나는 그가 투영 층으로 정의한 것을 발견했습니다. 비록이 용어가 word2vec을 언급 할 때 널리 사용 되긴했지만, 실제로 신경망 문맥에서의 정확한 정의를 찾을 수 없었습니다. 내 질문은, 신경

    6

    2답변

    워드 벡터 생성 방법은? 하나의 바로 가기 키를 사용하여 단어 벡터를 만들었지 만 매우 거대하고 비슷한 의미 단어로 일반화되지 않았습니다. 그래서 단어 유사성과 단어 벡터를 찾는 신경망을 사용하는 단어 벡터에 대해 들었습니다. 그래서이 벡터 (알고리즘)를 생성하는 방법이나 단어 벡터를 만들기 시작하는 좋은 방법을 알고 싶었습니다.