MIT의 WAMI API (또는 다른 음성 인식 API)와 impress.js를 사용하여 음성으로 제어되는 슬라이드 쇼를 만들고 싶습니다. "다음 페이지"또는 "돌아 가기"와 같은 간단한 명령을 포함하고 싶습니다.WAMI 및 impress.js를 사용하여 음성으로 제어되는 슬라이드 쇼를 어떻게 만들 수 있습니까?
가능합니까? 내가 어떻게 할 수 있니?
MIT의 WAMI API (또는 다른 음성 인식 API)와 impress.js를 사용하여 음성으로 제어되는 슬라이드 쇼를 만들고 싶습니다. "다음 페이지"또는 "돌아 가기"와 같은 간단한 명령을 포함하고 싶습니다.WAMI 및 impress.js를 사용하여 음성으로 제어되는 슬라이드 쇼를 어떻게 만들 수 있습니까?
가능합니까? 내가 어떻게 할 수 있니?
이 매우 비슷한 질문을 another post in stackoverflow하지만 그들은 구글의 음성 인식 API를 사용하고 싶었다. 이 질문에는 꽤 좋은 대답이 있습니다.
도 사용될 수있는 새로운 Speech API in Chrome 있습니다. 이 솔루션의 문제점은 음성 인식 엔진 (ASR)에 청취를 시작하라는 아이콘을 클릭해야하며 사용자는 특정 버전의 Chrome으로 제한된다는 것입니다. 이러한 솔루션의 대부분이 작동하는 방식은 사용자가 다음 번 음성을 듣기 위해 아이콘을 클릭해야한다는 것입니다. 따라서 ASR에 명령이 있으면 아이콘을 다시 클릭해야 다시 듣게됩니다. 매우 제한된 명령 집합 (예 : "다음"및 "뒤로")이있는 응용 프로그램의 경우에는 사용자가 응용 프로그램에 앞으로 또는 앞으로 가도록 지시하는 단추를 클릭하기 만하면되므로 많은 가치가 없습니다. 뒤로. 와미의 API는 당신이 더 나은 대안 인 프로그래밍 인식 프로세스를 시작할 수 있습니다처럼
는 것 같습니다. 이것은 사용자 입력을 청취하기 위해 웹 페이지에 포함시켜야하는 JavaScript API입니다. documentation for this API은 멀티 모달 음성 인식 응용 프로그램을 개발하는 방법에 대한 좋은 예를 제공합니다. 당신은 당신의 어플리케이션에서 당신이 찾고있는 발언을 스피치 엔진에 지정하는 문법을 개발하는 방법을 배워야 할 것입니다. WAMI는 JSpeech Grammar Format을 사용합니다. ASR에서 "다음"또는 "뒤로"중 하나를 인식하면 자바 스크립트를 사용하여 다음 또는 이전 슬라이드로 이동합니다.
플래시 및 sphinx4 http://cmusphinx.sourceforge.net으로 작성된 SpeechAPI를 사용할 수 있으며 브라우저에서 자바 스크립트로 인식 할 수 있습니다. 당신은 데모 및 여기에 물건을 찾을 수 있습니다
당신은
나는 것 음성 API를 소스 포지 프로젝트에서 서버를 사용하여 플래시와 함께 작동하도록 자신의 음성 인식 서버를 설치할 수 있습니다 브라우저에서 SpeechRecognition API를 사용하십시오.
자바 스크립트를 사용하여이 작업을 수행 할 수있는 쉬운 방법을, 음성 인식 슈퍼 쉽게 처리하게 라이브러리 인 annyang을 확인하십시오.