2017-05-04 7 views
0

유사성 (아마도 코사인)을 사용하여 일부 문장을 클러스터링하려고하고 있으며 분류기를 사용하여 미리 정의 된 클래스에 텍스트를 넣으려고합니다.Word2vec 분류 및 클러스터링 텐서 흐름

제 생각은 tensorflow를 사용하여 단어 삽입을 생성 한 다음 각 문장마다 평균을내는 것입니다. 다음으로 클러스터링/분류 알고리즘을 사용하십시오.

tensorflow가 word2vec 생성 알고리즘을 사용할 준비가 되었습니까?

단어 모델 가방이 좋은 출력을 생성합니까?

답변

1
  • 없음, tensorflow는 즉시 사용 word2vec을 제공하지 않습니다하지만 a tutorial on word2vec을 가지고있다.

  • 이 단어의 가방이 놀라 울 정도로 좋은 출력을 생성 할 수 있습니다 (하지만 최첨단의), 그리고 놀라 울 정도로 빠른되는 이점이있다. 나는 소량의 데이터 (수만 문장)를 가지고 있으며 분류 기준으로> 0.90 이상의 F1 점수를 받았습니다.

+0

글쎄 나는 Tensorflow에 대해 word2vec 또는 장갑을 사용할 준비가되지 않았다는 것을 알았습니다. 그들은 word2vec 모델을 구현하기위한 자습서를 제공했습니다. 나는 DL4J (JAVA)를 살펴 봤는데 나는 잠시 그걸 고수 할 것이라고 생각한다. – LonsomeHell