2016-07-11 2 views
0

나는 Transcriber 데모를 sphinx4 샘플로 실행 중입니다. 그러나 정확도는 낮습니다. Transcriber 소스에서 html 파일 중 하나는이 데모가 숫자 용이고 비 숫자 데이터를 기록하는 것은 config.xml을 수정한다는 것입니다. 그것은 "귀하의 목적에 맞게 구성 파일을 수정하는 방법에 대한 프로그래머 가이드를 참조하십시오." 하지만 나는 config.xml을 수정할 수있는 프로그래머 가이드를 찾지 못했습니다.Sphinx4에서 config.xml 변경

sphinx4가 비 디지트 데이터 전사에 대해보다 정확할 수 있도록 변경해야하는 내용을 알려주십시오.

답변

0

최근 transcriber 소스는 config.xml에 대해 아무 것도 말하지 않습니다. config.xml에서 아무 것도 변경하지 않는 것이 좋습니다. 최신 버전 sphinx4-5prealpha를 사용하십시오.

전사의 정확성에 대한 도움을 받으려면 sphinx4 사용법에 대한 추가 정보가 필요합니다. 또한 대본을 쓰려는 데이터를 제공해야합니다.

+0

저는 인터뷰 분석을하고 싶습니다. 타겟 인 사람들은 미국 대학의 대학생이어서 텍스트를 텍스트로 변환하고 분석하려고합니다. 나는 youtube에서 명확한 미국 목소리를 다운로드하고 16 비트 16kHZ wav 파일로 변환했다. 설명서에있는 간단한 Transcriber 데모 예제를 사용하고 있습니다. 어떻게 정확성을 향상시킬 수 있는지 말해주십시오. 나는 또한 20 문장으로 적응을 시도했다. –