저는 임베디드 장치 용 음성 인식 음성 인식 솔루션을 찾고 있습니다. 나는 pocketsphinx를 보았습니다. 그러나 아직 익숙하지 않기 때문에 더 경험이 많은 사람이 알고 있을지도 모른다고 생각했습니다. 그러한 음성 인식을 구현하기 위해 pocketsphinx를 사용할 수 있습니까? 어쿠스틱 및 언어 모델을 사용하는 대신 오디오를 녹음하고 기능을 추출한 다음 말한 내용과 일치시켜야합니다. pocketsphinx를 사용하여이 흐름을 구현할 수 있습니까? 그렇지 않으면 누군가가 그런 해결책을 내게 올바른 방향으로 가리킬 수 있습니까? 감사합니다.음성 의존 음성 인식
0
A
답변
1
pocketsphinx를 사용하여 음성 인식을 구현할 수 있습니까?
는
은 무엇 당신이 할 수있는 것은, 첫째 MFC 계수를 추출 예를 들어 sphinx_fe 소스를 볼 수 sphinxbase를 사용하는 것입니다 pocketsphinx API에는 이러한 기능이 없습니다.
그런 다음 DTW 알고리즘을 적용하여 기록을 비교할 수 있습니다.
뿐만 아니라 DTW를 구현하는 몇 가지 라이브러리가 있습니다http://en.wikipedia.org/wiki/Dynamic_time_warping
, 당신은 위키 피 디아 페이지의 링크를 찾을 수 있습니다 DTW의 구현은 코드의 단지 50 라인의 아주 간단합니다.
DTW 구현을 시연하는 pocketsphinx 패치를 보는 것이 좋을 것입니다.