0

특정 단어를 식별하기 위해 HMM (Hidden Markov Model)을 구현하고 싶습니다. 지금까지, 나는 신호의 계수 (MFCC)를 추출 할 수 있었고 이것이 HMM을 훈련시키기 위해 OK 데이터인지 궁금해했다.HMM - 교육 데이터 및 형식

또한 HMM 교육을위한 형식 (아래)이 맞습니까?

형식 :

의 Foreach 샘플, MFCC 계수들의 시퀀스있다 I 예로 들어이 샘플들의 두 제공 ...

-13.8033 0.645476 3.2174 -0.625136 -0.470134 -2.96368 0.701151 0.464246 1.1898 -1.88515 0.0805242 0.311573 0.732487

-19.4252 -5.65454 0.853437 0.317219 0.146167 -1.93742 0.381944 -2.01793 -0.561144 -0.896783 -0.105491 -1.06504 -0.797318

희망 누군가가 도울 수 있습니다 :)

+1

그 값이 MFCC 계수에 대한 합리적인 보이지만, 샘플 한 쌍의 볼 어렵다 그들이 올바른 알고 이 스레드에서 자세한 내용을 볼 수 있습니다. 나의 제안은 모델을 훈련시키고 그것이 어떻게 수행되는지를 보는 것이다. – user1955591

+0

@ user1955591 (훈련, 입력) 사이에 최상의 상태를 찾기 위해 viterbi 알고리즘을 사용할 수 있습니까? 예를 들어, "예"또는 "아니요"를 식별하는 경우 ..이 두 단어로 HMM을 학습하면 viterbi 알고리즘을 사용하여 입력 된 값과 훈련을 비교 하시겠습니까? 당신이 대답하기를 바랍니다. 감사합니다. – Phorce

+1

예, 비터 비 알고리즘을 사용하여 각 HMM을 통해 최상의 점수를 계산하고 최상의 점수 HMM을 선택하십시오. HTK와 같은 툴킷을 사용하고 있습니까? –

답변

0

두 가지 접근 방법이 있습니다.

연속체 MFCC 벡터를 HMM에 대한 이산 관측치로 변환하기 위해 벡터에 벡터 양자화를 수행합니다.

기타는 연속 접근법을 사용하여 HMM에서 교육을 수행합니다.

Simple speech recognition from scratch