language-model

1열

1답변

Tensorflow의 PTB 언어 모델에서 평가를위한 설정을 검사하는 동안, 나는 eval_config의 평가를 위해이 설정 당황하고 : eval_config = get_config() eval_config.batch_size = 1 eval_config.num_steps = 1 https://github.com/tensorflow/m

2열

1답변

nce_loss()의 Tensorflow num_classes 매개 변수

잡음 대조 계산을 이해하면 단어 삽입 (음수 샘플)에서 일부 벡터를 샘플링 한 다음 각각의 로그 가능성을 계산할 수 있습니다. 그런 다음 목표 단어의 확률과 음의 샘플 단어 각각의 로그 가능성 사이의 차이를 최대화하고 싶습니다 (따라서이 문제에 대해 정확하다면 손실 함수를 최적화하여 가능한 한 1). 내 질문은 이것이다 : nce_loss 함수에 num_c

0열

1답변

알 수없는 단어로 언어 모델 평가가 어떻게 작동합니까?

따라서 언어 모델을 구축 할 때 어휘 크기를 넘어 순위가 낮은 단어는 'UNK'로 대체됩니다. 제 질문은 'UNK'를 기반으로 확률을 평가하는 언어 모델을 평가하는 방법입니다. 우리가 테스트 세트에서 그러한 언어 모델의 난이도를 평가하기를 원한다면, 모델에 알려지지 않은 단어에 대해, 우리가 얻게 될 확률은 알려지지 않은 단어의 '가방'을 기반으로 평가됩니

2열

2답변

word2vec - 무엇이 가장 좋습니까? 단어 벡터를 추가, 결합 또는 평균합니까?

나는 반복적 인 언어 모델을 연구 중이다. 내 언어 모델을 초기화하는 데 사용할 수있는 단어 삽입을 학습하려면 gensim의 word2vec 모델을 사용하고 있습니다. 학습 후 word2vec 모델에는 단어 포함 (입력 행/숨겨진 행 행) 및 컨텍스트 삽입 (숨겨진/출력 행렬 열)이라는 어휘의 각 단어에 대해 두 개의 벡터가 있습니다. 두 매립 벡터에 결합

1열

1답변

gensim word2vec 모델에 주어진 텍스트 삽입 모델의 확률을 얻기

gensim word2vec 모델을 사용하여 가장 가능성있는 단어 시퀀스를 얻으려고합니다. 나는 이러한 파일을 제공하는 pretrained 모델을 발견했다 : word2vec.bin word2vec.bin.syn0.npy word2vec.bin.syn1neg.npy 이 내 코드는이 모델과 문장의 확률을 얻기 위해 노력하고있다 :이 오류가 발생하고이

0열

1답변

언어 모델과 통합 된 Tensorflow 음성 인식을 작성하는 방법

텐서 흐름 음성 인식 아키텍처에서 언어 모델을 통합하려면 어떻게합니까? 언어 모델이 통합되어 있지 않으면 Tensorflow (예 : https://github.com/nervanasystems/neon, https://github.com/buriburisuri/speech-to-text-wavenet)에서 문자 수준 음성 인식을 구현하는 데 유용한 예제가

0열

1답변

kenlm을 사용하는 부정적인 결과

언어 모델링에 익숙하지 않고 큰 텍스트 파일 (~ 7GB)에서 kenlm (또는 this)을 사용하는 3grams 언어 모델을 만듭니다. 내 언어 모델의 바이너리 파일을 확인하고이 같은 파이썬에서 전화 : import kenlm model = kenlm.LanguageModel(<my .klm file>) model.score(<my sentence>)

-1열

1답변

PocketSphinx 용 언어 모델

나는 PocketSphinx와 함께 자연어 용 음성 인식기를 만들었습니다. 나는 문법을 사용하는 것이 아니라 오히려 언어 모델을 사용하고 싶다. 온라인에서 이미 수행 된 작업을 찾을 수 없습니까? 모두가 this page을 연결하고 있지만 음향 모델 만 포함되어 있습니다. 통계 언어 모델로 .dmp 또는 ARPA 파일을 찾고 있습니다. 혼자서 만들 수는 있

0열

1답변

언어 모델을 배우는 방법은 무엇입니까?

저는 Penn Treebank (PTB) 코퍼스를 기반으로하는 LSTM을 사용하여 언어 모델을 교육하려고합니다. 나는 이전 단어들에 주어진 다음 단어를 예측할 수 있도록 코퍼스의 모든 바이 그램을 훈련해야한다고 생각했지만 여러개의 선행 단어에 기반하여 다음 단어를 예측할 수 없었습니다. 그래서 언어 모델을 교육하는 것이 정확히 무엇입니까? 현재 구현에서 일

0열

1답변

어설 션`THIndexTensor_ (size) (target, 0) == batch_size '실패했습니다.

PyTorch로 파이썬 코드를 작성할 때 발생했습니다. CrossEntropyLoss를 사용하여 간단한 언어 모델을 구성하려고하지만이 오류가 발생했습니다. 실제로, 나는이 코드를 this에 따라 썼다. 여기 내 코드가있다. 여기 import numpy as np import torch from torch.autograd import Variable i