2012-11-13 1 views
3

CMU 스핑크스를 기반으로하는 음성 인식 앱을 만들려고합니다. lmtool을 사용하여 자체 언어 모델을 만들었습니다. 그러나 인식의 정확성을 높이기 위해 스핑크스를 조정하고 싶습니다. 그러나 absoluteBeamWidth, relativeBeamWidth, absoulteWordBeamWidth, languageWeight와 같은 속성을 선택하기위한 지침이 있습니까? 이러한 속성의 의미를 정확히 알 수 없습니다. 또한 스핑크스 튜닝에 도움이 될 수있는 리소스에 대한 링크 (스핑크스 웹 사이트의 불완전 튜닝 링크는 제외)를 보내 주시면 감사하겠습니다. 튜닝 CMU 스핑크스

당신에게

답변

2

감사하지만, 나는 스핑크스 조정하려는 인식의 정확도를 개선하기 위해 중위.

정확도는 튜닝을 통해가 아니라 더 나은 모델과 고급 알고리즘을 사용하여 향상되었습니다. 자세한 내용은 FAQ를 참조하십시오 : 확인

http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor

+0

을 우리가 absoluteBeamWidth, relativeBeamWidth, absoulteWordBeamWidth 및 languageWeight 같은 속성을 사용하여 왜 .... – Shishya

+3

음성 인식은 기본적으로 적절한 결과를 검색합니다. 빔은 최상의 점수보다 낮은 점수를받은 변형을 삭제하여 검색을 제한합니다. 상대적 빔 폭은 스코어가 빔 시간이 더 작은 경로에 영향을줍니다. Absolute beam은 매 프레임마다 탐색되는 절대 경로를 선택합니다. 단어 빔은이 특정 프레임에서 단어 끝을 고려하지만 빔은 모든 경로를 고려합니다. 빔 속도가 작 으면 검색 속도가 빨라지고 빔이 넓어지면 속도가 느려집니다. 언어 가중치는 언어 모드의 효과를 제어합니다. 일반적으로 실험 중에 선택됩니다. –

+0

기본값은 대개 옳습니다. 조정이 크게 향상되지 않습니다. –