speech recognition에서이 가이드를 읽었으며 음성 인식에 필요한 세 가지 항목이 있다고 언급했습니다. 음향 모델, 언어 모델, 발음 사전입니다.PocketSphinx python 및 어쿠스틱 모델 설정?
Gstreamer를 사용하여 마이크에서 캡처하고 8kHz, 16 비트 PCM 오디오로 리샘플링하는 python demo으로 연주하고 싶었습니다.
은 내가 언어 모델 및 음성 사전을 지정할 수 있음을보고, 나는 [CMU에 의해 제공] 한 사용http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/
을하지만 내가 음향 모델을 지정해야하는 위치 혼란 스러워요? gstreamer가 암시 적으로 사용하고있는 자체 음향 모델을 가지고 있습니까? 나는 약간 더 나은 결과를 위해 여기에 제공된 음향 모델을 사용하는 것이 기대했다 :
http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/
(. 하이퍼 링크에 대해 내가 10 미만 담당자와 2 개 이상의 링크를 게시 할 수 없습니다 죄송합니다)