speech

-1열

1답변

나는 내 Mac에서 신속하게 작동하는 텍스트로 말하기를 얻으려고합니다. 몇 가지 기사를 찾았지만 모두 iOS 용입니다. 나는 따라 시도하고이 하나 http://www.appcoda.com/siri-speech-framework/ 지금까지이 놀이터에서 내 코드입니다 : //: Playground - noun: a place where people can pl

0열

1답변

오디오에서 단어의 타임 스탬프 찾기

나는 인간의 음성으로 된 오디오 파일을 가지고 있습니다. 오디오 길이는 약 1 분입니다. 오디오에서 사용 된 단어 나 구의 타임 스탬프를 찾고 싶습니다. 작업을 수행 할 수있는 기존 라이브러리가 있습니까?

0열

1답변

녹음 연설 naudio

I 캡처 및 디스크에 기록 할 naudio을 초기화하는 코드를 naudio.Following이다 사용 UWP에 기록 사용자 연설에 노력하고 있습니다 : sourcestream = new WasapiCaptureRT(); sourcestream.WaveFormat = new WaveFormat(8000, 8, 1); sourcestream.DataAva

3열

1답변

iOS 음성 인식 API에 힌트를 제공하는 방법은 무엇입니까?

iOS 음성 API를 사용하여 음성 입력을 수신하는 앱을 만들고 싶습니다. Google의 API에는 희귀 한 단어에 힌트 또는 바이어스를 제공 할 수있는 speechContext 용 옵션이 있습니다. iOS API가이 기능을 제공합니까? 나는 잠시 동안 사이트를 찾고 있었지만 아무 것도 찾지 않았다.

0열

2답변

tensorflow에 음성 훈련 데이터를 추가하는 방법

길쌈 된 신경 회로망을 훈련시키기 위해 .wav 파일을 분류했습니다. 이것은 표준 Dataset을 사용할 수없는 Bengali 전화 용입니다. 내 CNN 모델을 교육하기 위해이 .wav 파일을 Tensorflow에 입력하고 싶습니다. 내 모델에 대해 입력되는이 .wav 파일에서 그레이 스케일 스펙트로 그램을 만들고 싶습니다. 그렇게하는 방법에 도움이 필요합

1열

1답변

Google 클라우드 음성 API 단어 힌트

Google 클라우드 음성 API에서 단어 힌트를 사용하면 brook.flac에 Rest API Executor를 사용하려고합니다. 브루클린 대신에 브룩클린이라는 문구를 입력했지만 그 결과는 같습니다. 그들은 전혀 작동합니까? 주어진 인식 작업에 대한 https://cloud.google.com/speech/docs/basics#phrase-hints 에서

0열

1답변

음성을 저장하는 버튼 만들기

어쨌든 버튼에 소리 또는 음성을 저장할 수 있습니까? 소리 또는 녹음 된 음성을 저장하는 여러 개의 단추가있는 응용 프로그램을 만들려고합니다. 지금까지 나는 운이 없었고, 나는 이것에 접근하는 방법에 대해 너무 확신하지 못한다.

1열

1답변

단어 인식 사용자 지정 언어 [예 : Elvish]

영어 단어의 간단한 단어 인식을 개발하고 싶다면 어디에서 시작해야합니까? 많은 기사를 읽었지만 사용자 지정 언어가 아닌 영어로 된 음성 인식에 관한 내용입니다.

0열

1답변

Google은 음성 녹음을 녹음하기 위해 음성을 사용하여 애플리케이션을 찾을 수 있습니까?

Google 클라우드 음성을 사용하는 응용 프로그램 (Windows, Linux 또는 IOS)을 찾고 있습니다. 일부 Python 스크립트를 실행하는 데 성공하지 못했습니다 (API 및 내 json 키 생성 사용)

2열

1답변

시간 값을 사용하여 파형 플롯의 색상 변경

현재 음성 처리 프로젝트를 진행 중이며 스페인어 (aire)로 된 단어의 시간 파형과 관련하여 빠른 질문을했습니다. 난 인공 지능은 음소를 포함하는 파형 부분을 강조 할. Audacity를 사용하여 음소가 발생하는 시간대를 표시 할 수 있었고 파형의 해당 부분의 색상을 어떻게 바꿀 수 있는지 알고 싶었습니다. 나는 MatLab에서 hold on 함수를 사용