2017-10-24 7 views
0

GloVe를 사용하여 문서에 단어 삽입을 구성하려고합니다. 다음과 같이 단일 단어 (unigrams)에 대한 벡터 삽입을 얻는 방법을 알고 있습니다 (예제 텍스트 문서의 경우).GloVe의 N 그램

$ git clone http://github.com/stanfordnlp/glove 
$ cd glove && make 
$ ./demo.sh 

이제 bigram의 벡터 삽입을 원합니다. 예를 들어;

  1. "뉴욕"-> 대신 "새로운"및 "뉴욕"
  2. "기계 학습"-> 대신 "기계", 그리고

그것이 가능 "학습" 글로브에서해야 할 일? 그렇다면 어떻게?

+0

* 소스 *를 사용하십시오. –

+0

분명히 중요하지 않은 단어와 진행중인 연구 주제에 대한 단어 삽입에 대한 삽입을 얻는 것에 주목하십시오. – gented

답변

0

나는 bigram 벡터를 사용할 수 있다고 생각하지 않지만, 당신은 코퍼스를 사전 처리하여 직접 만들 수 있습니다.

GloVe is love 

당신은 다음과 같은 포맷 할 수 있습니다 :

START_GloVe GloVe_is is_love love_END 

을 그리고 평소와 같이이 신체에 묻어 세트를 훈련 예를 들어 귀하의 코퍼스의 문서는 다음과 같습니다합니다. 유사한 this post에서와 같이 Word2vec를 살펴볼 수도 있습니다.