2012-01-13 2 views

답변

1

이 매우 비슷한 질문을 another post in stackoverflow하지만 그들은 구글의 음성 인식 API를 사용하고 싶었다. 이 질문에는 꽤 좋은 대답이 있습니다.

도 사용될 수있는 새로운 Speech API in Chrome 있습니다. 이 솔루션의 문제점은 음성 인식 엔진 (ASR)에 청취를 시작하라는 아이콘을 클릭해야하며 사용자는 특정 버전의 Chrome으로 제한된다는 것입니다. 이러한 솔루션의 대부분이 작동하는 방식은 사용자가 다음 번 음성을 듣기 위해 아이콘을 클릭해야한다는 것입니다. 따라서 ASR에 명령이 있으면 아이콘을 다시 클릭해야 다시 듣게됩니다. 매우 제한된 명령 집합 (예 : "다음"및 "뒤로")이있는 응용 프로그램의 경우에는 사용자가 응용 프로그램에 앞으로 또는 앞으로 가도록 지시하는 단추를 클릭하기 만하면되므로 많은 가치가 없습니다. 뒤로. 와미의 API는 당신이 더 나은 대안 인 프로그래밍 인식 프로세스를 시작할 수 있습니다처럼

는 것 같습니다. 이것은 사용자 입력을 청취하기 위해 웹 페이지에 포함시켜야하는 JavaScript API입니다. documentation for this API은 멀티 모달 음성 인식 응용 프로그램을 개발하는 방법에 대한 좋은 예를 제공합니다. 당신은 당신의 어플리케이션에서 당신이 찾고있는 발언을 스피치 엔진에 지정하는 문법을 개발하는 방법을 배워야 할 것입니다. WAMI는 JSpeech Grammar Format을 사용합니다. ASR에서 "다음"또는 "뒤로"중 하나를 인식하면 자바 스크립트를 사용하여 다음 또는 이전 슬라이드로 이동합니다.

1

나는 것 음성 API를 소스 포지 프로젝트에서 서버를 사용하여 플래시와 함께 작동하도록 자신의 음성 인식 서버를 설치할 수 있습니다 브라우저에서 SpeechRecognition API를 사용하십시오.

자바 스크립트를 사용하여이 작업을 수행 할 수있는 쉬운 방법을

, 음성 인식 슈퍼 쉽게 처리하게 라이브러리 인 annyang을 확인하십시오.