2016-06-02 13 views
1


안녕하세요. (이 문장을 시작하는 것이 좋습니까?) HTK 공구 및 샘플링 속도

음성 (단어) 인식이있는 HTK 도구로 시뮬레이션하려고했습니다.
그리고 * .wav 파일이 있습니다.
일부 파일의 경우 16KHz 샘플링 속도가 있고 일부 파일의 경우 44.1KHz 샘플링 속도가 있습니다.

그리고 각 샘플링 속도에 대해 mfcc 파일을 만듭니다.
그러나 모든 (16KHz 및 44.1KHz의) mfcc 파일을 사용하여 HMM 모델을 만듭니다.

voice_16KHz.wav -> voice_1.mfcc 
voice_44.1KHz.wav -> voice_2.mfcc 
make hmm_model using voice_1.mfcc and voice_2.mfcc 

다른 샘플링 속도를 혼합하여 HMM 모델을 만들면 괜찮습니까?

필자는 반드시 정보가 아니라 제안을 알고 있어야합니다.

읽어 주셔서 감사합니다.

답변

1

하나의 샘플링 속도에 대해서만 제안 할 것입니다. 작동하지만 정확도가 변경되며 MFCC 구성 파일의 구성 세부 사항을 변경해야합니다. 44.1KHz 파일을 16KHz로 다운 그레이드하는 것은 매우 쉽습니다.