2012-11-30 1 views
5

speech recognition에서이 가이드를 읽었으며 음성 인식에 필요한 세 가지 항목이 있다고 언급했습니다. 음향 모델, 언어 모델, 발음 사전입니다.PocketSphinx python 및 어쿠스틱 모델 설정?

Gstreamer를 사용하여 마이크에서 캡처하고 8kHz, 16 비트 PCM 오디오로 리샘플링하는 python demo으로 연주하고 싶었습니다.

은 내가 언어 모델 및 음성 사전을 지정할 수 있음을보고, 나는 [CMU에 의해 제공] 한 사용

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/ 

을하지만 내가 음향 모델을 지정해야하는 위치 혼란 스러워요? gstreamer가 암시 적으로 사용하고있는 자체 음향 모델을 가지고 있습니까? 나는 약간 더 나은 결과를 위해 여기에 제공된 음향 모델을 사용하는 것이 기대했다 :

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/ 

(. 하이퍼 링크에 대해 내가 10 미만 담당자와 2 개 이상의 링크를 게시 할 수 없습니다 죄송합니다)

답변

3

그러나 나는 어쿠스틱 모델을 어디에 지정해야하는지 혼란 스럽다.

gstreamer 요소의 hmm 특성을 사용하여 모델을 지정할 수 있습니다. 이

asr.set_property('lm', '/home/user/mylanguagemodel.lm') 

튜토리얼

에 덮여 것처럼 당신은

asr.set_property('hmm', '/home/user/acoustic_model_folder') 

가 gstreamer를 내가 암시 적으로 사용하고 자신의 음향 모델이 있습니까 사용할 수 있습니까?

예, 기본적으로는 유통에서 미국 영어 모델 hub4wsj_sc_8k을 사용