나는 웹 사이트를 개발하고 있어요, 내가 시각 장애인이 음성으로 사용하는 데 도움이하고 싶은, 그래서 사용을 위해 : 텍스트 음성 변환 사용자가 이미 일부 텍스트를 음성으로 자바 스크립트 라이브러리가 하나 을 선택하는 그녀의 목소리를 사용할 수 있도록 사용자 음성 - 텍스트 일부 posibilities을 제공하는 (같은 speak.js)하지만, 지금 나는
오디오 및 음성의 일반 텍스트 사본이 있다고 가정 할 때 음성 인식을 사용하여 어떻게 프로그래밍 방식으로 자막을 생성 할 수 있습니까? 이것은 비디오를 편집 할 때 YouTube가 캡션/자막 페이지에서 제공하는 것과 매우 비슷합니다. 어떤 API를 사용할 수 있습니까? 어떤 문제가 있습니까? 저는 Java/C#을 가장 잘 유창하지만 언어에 구애받지 않습니다
다른 스크립트로 조작 할 수있는 텍스트 문자열을 출력 할 수있는 작은 AppleScript를 작성하려고합니다. 작동 방식 : tell application "SpeechRecognitionServer"
set display to no
set theResponse to listen for {"yes", "no"}
if theResp
음성을 텍스트로 변환하는 API를 사용하여 mp3를 실행하는 데 필자는 프로그램과 라이브러리를 장기간 묶어서 구축하려고합니다. 파일을 사람이 읽을 수있는 텍스트로 변환합니다. 이 온라인 작업을 수행하는 API가 거의 없다는 사실에 놀랐습니다. speech2text 프로젝트는 Google의 비공식적 인 Speech-To-Text API에 연결되는 https:
RecognizerIntent에 맞춤식 언어를 추가 할 수 있습니까? 나는 SO 전환을 텍스트로 연설하는 동안 언어의 제한 번호를 사용하여 내 문제를 해결 https://stackoverflow.com/questions/2080401/is-there-a-speech-to-text-api-by-google 같은 질문을 많이 검색 할 수 있습니다. 내 문제는
burmese 언어에 대한 음성 인식을 원합니다. 나는 다음 링크를 참조하십시오 http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/ http://cmusphinx.sourceforge.net/sphinx4/ http://cmusphinx.sourceforge.net/2011/
Vlingo를 응용 프로그램으로 만드는 방법은 무엇입니까? ios 용 앱을 만드는 데 사용할 수있는 API가 있습니까? 몇 가지 가이드 라인 또는 자습서 또는 도움을 제공하거나 주석 사전에 감사를 이해할 수있을 것이다하시기 바랍니다 우리가 재미에서 반복 이야기로 나는 또한 이야기 벤 개와 이야기 톰 고양이가 작동하는 방법을 알고 싶습니다 목소리. 어떻게