0
샘플로 제공되는 기존의 사전 훈련 모델을 사용하여 ASR system
을 만들려고합니다. 나는 그 훈련 된 모델에 새로운 단어를 추가하는 방법에 매달려 다음 번에 정확하게 단어를 반환 할 것입니다. 기계 학습 개념의 일종입니다. 어떤 아이디어라도 도움이 될 것입니다.어떻게 kaldi 플랫폼에 새로운 단어 나 어휘를 추가 할 수 있습니까?
샘플로 제공되는 기존의 사전 훈련 모델을 사용하여 ASR system
을 만들려고합니다. 나는 그 훈련 된 모델에 새로운 단어를 추가하는 방법에 매달려 다음 번에 정확하게 단어를 반환 할 것입니다. 기계 학습 개념의 일종입니다. 어떤 아이디어라도 도움이 될 것입니다.어떻게 kaldi 플랫폼에 새로운 단어 나 어휘를 추가 할 수 있습니까?
두 가지 당신이해야 할 수도 있습니다
어휘가 : 데이터 폴더에 lexicon.txt
같은 것을 찾아보십시오처럼, 그것은 당신의 단어와 해당 전화 시퀀스를 추가
speech s p iy ch
the dh ax
the dh iy
언어 모델 : 데이터 폴더에서 XXX.lm
과 같은 것을 찾아서 다음과 같이 1-gram으로 단어를 추가하십시오.
\data\
ngram 1=200
ngram 2=4000
...
\1-grams
-7.3241 the
...
그런 다음이 두 개의 새 파일을 기반으로 디코더 HCLG.fst
을 다시 만듭니다.
참고 : 음성 인식의 결과가 다른 것 언어로 숫자, 당신은 당신의 신체의 텍스트로를 생성하기 위해 적절한 수 또는 사용 툴킷 srilm
를 선택해야합니다.