2017-03-15 8 views
1

러시아어로 음성 인식을해야합니다. 나는 project page에서 튜토리얼을 따라 갔다. 튜토리얼에서 CMU 스핑크스의 소리 나는 언어 모델을 만드는 방법은 무엇입니까?

나는

당신은 텍스트를 가지고 당신의 langauge에 대한 음성 사전을 사용하여 음성 문자열로 변환 할 수 있습니다 참조하십시오. 단어를 대응하는 필사본으로 바꿉니다. 휴대 전화의 수가 적기 때문에 텍스트도 큰 것이 아니어야합니다. 책 하나만 있으면됩니다.

어디에서 음성 사전을 찾을 수 있습니까? 전체 책에서 해당 단어를 어떻게 대체 할 수 있습니까?

또는 완전한 음운론 모델을 찾을 수 있습니까?

제가 라인 파일 TEST.TXT 생성

업데이트 :

SIL I0의 LJ J의 A1의 I1를 LJ FJ E0 V GJ E1 NJ I0의 J PJ E0 TR O1 VZ O0 L O0 t의 O1 j tj e0 lj o1 n o0 k SIL

이것은 러시아어로 대체 된 회선 형식 테스트 wav 파일이며 발음 사전 형식 사전 (ru.dic)입니다.

은 그 때 나는 명령 모드를 구축하는 SRILM을 사용 :

N- 그램 카운트 -interpolate -text있는 test.txt -lm test.phonetic.lm

다음을 내가 명령으로 시작합니다

디버그 \는 Win32 \ pocketsphinx_continuous.exe -samprate 16000 -allphone testModel \ test.phonetic.lm -hmm cmusphinx-RU-5.2 -remove_noise없는 -infile testModel의 \ 디코더 test.wav -backtrace 예

\

pocketsphinx \ bin에

그러나 내가 그것을 사용할 때 잘못된 음소로 잘못된 결과가 나타납니다.

답변

0

어디에서 음성 사전을 찾을 수 있습니까? 나는 전체 책에서 그에 상응하는 전사로 단어를 대체 할 수있는 방법

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Russian/cmusphinx-ru-5.2.tar.gz/download

내부

파일 ru.dic? 완전한 음성 모델을 찾을 수 있습니다 파이썬

Or..where I에서 스크립트와

?

직접 작성해야합니다.

+0

죄송합니다. 더 자세히 설명해 주시겠습니까? 나는 아직도 그것을 할 수 없다. – gado

+0

내 첫 번째 소식을 업데이트했습니다 – gado

+0

새로운 주제에 대해 새로운 질문을하고 문제를 재현 할 데이터 파일을 제공해야합니다. –