나는 내 Mac에서 신속하게 작동하는 텍스트로 말하기를 얻으려고합니다. 몇 가지 기사를 찾았지만 모두 iOS 용입니다. 나는 따라 시도하고이 하나 http://www.appcoda.com/siri-speech-framework/ 지금까지이 놀이터에서 내 코드입니다 : //: Playground - noun: a place where people can pl
I 캡처 및 디스크에 기록 할 naudio을 초기화하는 코드를 naudio.Following이다 사용 UWP에 기록 사용자 연설에 노력하고 있습니다 : sourcestream = new WasapiCaptureRT();
sourcestream.WaveFormat = new WaveFormat(8000, 8, 1);
sourcestream.DataAva
iOS 음성 API를 사용하여 음성 입력을 수신하는 앱을 만들고 싶습니다. Google의 API에는 희귀 한 단어에 힌트 또는 바이어스를 제공 할 수있는 speechContext 용 옵션이 있습니다. iOS API가이 기능을 제공합니까? 나는 잠시 동안 사이트를 찾고 있었지만 아무 것도 찾지 않았다.
길쌈 된 신경 회로망을 훈련시키기 위해 .wav 파일을 분류했습니다. 이것은 표준 Dataset을 사용할 수없는 Bengali 전화 용입니다. 내 CNN 모델을 교육하기 위해이 .wav 파일을 Tensorflow에 입력하고 싶습니다. 내 모델에 대해 입력되는이 .wav 파일에서 그레이 스케일 스펙트로 그램을 만들고 싶습니다. 그렇게하는 방법에 도움이 필요합
Google 클라우드 음성 API에서 단어 힌트를 사용하면 brook.flac에 Rest API Executor를 사용하려고합니다. 브루클린 대신에 브룩클린이라는 문구를 입력했지만 그 결과는 같습니다. 그들은 전혀 작동합니까? 주어진 인식 작업에 대한 https://cloud.google.com/speech/docs/basics#phrase-hints 에서
현재 음성 처리 프로젝트를 진행 중이며 스페인어 (aire)로 된 단어의 시간 파형과 관련하여 빠른 질문을했습니다. 난 인공 지능은 음소를 포함하는 파형 부분을 강조 할. Audacity를 사용하여 음소가 발생하는 시간대를 표시 할 수 있었고 파형의 해당 부분의 색상을 어떻게 바꿀 수 있는지 알고 싶었습니다. 나는 MatLab에서 hold on 함수를 사용