2015-01-20 3 views
1

Sphinx4 라이브러리를 음성 인식에 사용하려하지만 음향 모델 - 사전 언어 모델의 올바른 조합을 파악할 수 없습니다. 나는 다양한 조합을 시도하고 매번 다른 오류가 발생합니다.Sphinx4 정확한 모델 알아 내기

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4에 대한 지침을 따르려고합니다. 구성 파일의 위치를 ​​Config 자체에 전달하는 인식 가능한 방법이 없기 때문에 Configuration.xml 대신 ConfigurationManager를 사용하는 것처럼 config.xml이 없습니다 (ConfigMgr은 생성자에 대한 인수로 사용합니다). 그게 내 문제 야. 나는이 튜토리얼에 "XML 파일을 통해 응용 프로그램의 저수준 구성 요소를 구성하는 것이 가능합니다.하지만 그 일을 이해하는 경우에만해야합니다."라고 말한 이후, 나는 하나를 가리키는 방법을 모르고 있습니다. config.xml 파일을 갖는 것은 필수가 아닙니다.

최신 사전 (7b - Sourceforge에서 얻음)을 최신 음향 모델 (cmusphinx-en-us-5.2.tar.gz - SF에서 다시)과 언어 모델 (cmusphinx-5.0-en-us)으로 결합합니다. lm.gz - SF에서 다시) NullPointerException의 결과는 startRecognition입니다. 문제는 여기의 문제와 비슷합니다 : sphinx-4 NullPointerException at startRecognition,하지만 답변에 제공된 링크가 더 이상 작동하지 않습니다. SF에서 0.7a를 얻었습니다 (링크가 가리키는 딕트이기 때문에). 그러나 그 번호를 사용하면 Error loading word: ;;; 실행이 훨씬 빨라졌습니다. 최신 모델을 다운로드하려고 시도하고 Github 레포에서 그 결과는 java.lang.IndexOutOfBoundsException: Index: 16128, Size: 16128입니다.

도움을 주시면 감사하겠습니다.

답변

0

당신은 GitHub의에서 최신 코드를 사용할 필요가 튜토리얼에 의해 설명 된 바와 같이

http://github.com/cmusphinx/sphinx4

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

올바른 모델 (우리가 KO-)가 이미 포함되어 있습니다, 당신은 아무것도를 대체하지한다 . 소스에서 제공된대로 샘플을 사용하여 XML 파일을 구성하면 안됩니다.

+0

github 저장소를 복제 한 후에 만 ​​config.xml 파일을 사용하는 Context 클래스라는 것을 알 수있었습니다. 의심 스럽지만 내 문제였습니다. Configuration 객체의 어쿠스틱, dict 및 언어 모델 경로를 설정하는 기본 클래스 만 사용하는 것만으로는 충분하지 않습니다. config.xml에 대한 경로는 Context 클래스 내에 ConfigMgr과 함께 설정됩니다. 도와 주셔서 감사합니다. – mori