러시아어로 음성 인식을해야합니다. 나는 project page에서 튜토리얼을 따라 갔다. 튜토리얼에서 CMU 스핑크스의 소리 나는 언어 모델을 만드는 방법은 무엇입니까?
나는당신은 텍스트를 가지고 당신의 langauge에 대한 음성 사전을 사용하여 음성 문자열로 변환 할 수 있습니다 참조하십시오. 단어를 대응하는 필사본으로 바꿉니다. 휴대 전화의 수가 적기 때문에 텍스트도 큰 것이 아니어야합니다. 책 하나만 있으면됩니다.
어디에서 음성 사전을 찾을 수 있습니까? 전체 책에서 해당 단어를 어떻게 대체 할 수 있습니까?
또는 완전한 음운론 모델을 찾을 수 있습니까?
제가 라인 파일 TEST.TXT 생성
업데이트 :
SIL I0의 LJ J의 A1의 I1를 LJ FJ E0 V GJ E1 NJ I0의 J PJ E0 TR O1 VZ O0 L O0 t의 O1 j tj e0 lj o1 n o0 k SIL
이것은 러시아어로 대체 된 회선 형식 테스트 wav 파일이며 발음 사전 형식 사전 (ru.dic)입니다.
은 그 때 나는 명령 모드를 구축하는 SRILM을 사용 :
N- 그램 카운트 -interpolate -text있는 test.txt -lm test.phonetic.lm
다음을 내가 명령으로 시작합니다
디버그 \는 Win32 \ pocketsphinx_continuous.exe -samprate 16000 -allphone testModel \ test.phonetic.lm -hmm cmusphinx-RU-5.2 -remove_noise없는 -infile testModel의 \ 디코더 test.wav -backtrace 예 \pocketsphinx \ bin에
그러나 내가 그것을 사용할 때 잘못된 음소로 잘못된 결과가 나타납니다.
죄송합니다. 더 자세히 설명해 주시겠습니까? 나는 아직도 그것을 할 수 없다. – gado
내 첫 번째 소식을 업데이트했습니다 – gado
새로운 주제에 대해 새로운 질문을하고 문제를 재현 할 데이터 파일을 제공해야합니다. –