많은 오디오 형식 (예 : mp3, m4a), 소스 (예 : 음성 받아쓰기, 명령, 전화 통화, 회의) 및 장치 (예 : 전화, PC, IoT 장치)가 있습니다. Cloud Speech API와 가장 잘 맞는 것은 무엇입니까?Cloud Speech API는 어떤 유형의 오디오를 지원합니까?
0
A
답변
-2
Cloud Speech API는 REST 또는 gRPC 요청을 생성 할 수있는 모든 앱 또는 IoT 기기와 통합 될 수 있습니다. 특히, 명령을 내고, 구술을 전사하거나, 스피커가 마이크에 가깝고 녹음 품질이 좋은 경우 (예 : 16khz 디지털 녹음)에는 특히 유용합니다.
4
Cloud Speech API와 가장 잘 맞는 것은?
지원 사람은 잘 작동한다
- LINEAR16 비 압축 16 비트 리틀 엔디안 샘플을 체결했다. speech.asyncrecognize에서 사용할 수있는 유일한 인코딩 인 입니다.
- FLAC speech.syncrecognize 및 에 권장되는 인코딩으로 무손실 압축을 사용하므로 StreamingRecognize입니다. 따라서 손실 코덱으로 인식 정확도가 저하되지 않습니다.
- MULAW G.711 PCMU/mu-law를 사용하는 14 비트 오디오 샘플을 포함하는 8 비트 샘플입니다.
- AMR 적응 형 멀티 레이트 협 대역 코덱. sampleRate는 8000Hz 여야합니다.
- AMR_WB 적응 형 다중 속도 광대역 코덱. sampleRate는 16000 Hz 여야합니다.
https://cloud.google.com/speech/reference/rest/v1beta1/RecognitionConfig#AudioEncoding