3

이것은 거의 읽지 않아도 될지 모르지만 나랑 벗겨주세요. 나는 이것에 대한 많은 기사를 읽었지만, 나는 어떻게해야하는지 이해하지 못한다.Train speech HMM with MFCC with Matlab hmmtrain

HMM에 MFCC 기능을 사용하여 기본 음성 인식 시스템을 구축하려고합니다. 사용 가능한 데이터는 here입니다. 저는 이것을하기 위해 Matlab을 사용하고 있습니다.

지금까지 나는 this library을 사용하여 음성 파일에서 MFCC 벡터를 추출했습니다. 내가 이해할 수없는 것은 어떻게 HMM에 이러한 기능을 사용 하는가입니다.

어떻게하면 HMM을 훈련시킬 수 있습니까? matlab에있는 hmm 구현을 사용하고 있습니다. 제가 실제로 흠의 일을 이해하기 위해 노력하고 있기 때문에 제게 다른 도서관을 추천하지 마십시오.

  • 전환 및 방출 행렬을 어떻게 초기화합니까?

  • 각 상태가 단어의 특정 음소를 방출한다고 가정합니다. 그래서 HMM을 훈련 시키려면 어떻게 MFCC 벡터를 전달해야합니까?

  • HMM을 교육하기 위해 수행해야하는 단계는 무엇입니까?

은닉 마르코프의 matlab에 구현 기능이 here

편집을 부여 : 그것은 오랜 시간이되었습니다,하지만 문제는 여전히 공격 뷰의 양만큼 관련 가정, 나는 이것을 해결했다 코드는 내 GitHub에서 찾을 수 있습니다.

답변

1

이 HMM을 MFCC 벡터에서 음성 HMM을 학습하는 데 사용할 수 없습니다. 이 프레임 워크는 번호 시퀀스 만 지원하고, 기능 벡터를 지원하지 않습니다. 이것은 단순한 이산 HMM 도구 상자입니다. 내가 아는 한, 내가 음소가 출력됩니다 고려하고, 내가 머피의 도구 상자로 전환하고있어 조언을

http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html

+0

감사 :

당신은 이와 같은 음성 중심의 라이브러리를 사용해야 HMM의 각 주마다, MFCC 벡터가 어떻게 작동하는지 이해하지 못합니다. HMM을 훈련 시키는데 정확히 어떻게이 기능들을 사용하는지 설명해 주시겠습니까? –

+1

Rabiner의 HMM 튜토리얼을 읽으면 HMM에 대한 명확한 그림을 얻을 수 있습니다. http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf 기능은 HMM 알고리즘에 입력됩니다. 기능 배열을 입력하면 알고리즘이 출력 레이블 (전화)에 기능을 할당하고 그러한 할당 확률을 제공합니다. 정렬은 감독되지 않은 방식으로 수행됩니다. –