Google 클라우드 음성 API에서 단어 힌트를 사용하면 brook.flac에 Rest API Executor를 사용하려고합니다. 브루클린 대신에 브룩클린이라는 문구를 입력했지만 그 결과는 같습니다. 그들은 전혀 작동합니까? 주어진 인식 작업에 대한 https://cloud.google.com/speech/docs/basics#phrase-hintsGoogle 클라우드 음성 API 단어 힌트
에서
Google 클라우드 음성 API에서 단어 힌트를 사용하면 brook.flac에 Rest API Executor를 사용하려고합니다. 브루클린 대신에 브룩클린이라는 문구를 입력했지만 그 결과는 같습니다. 그들은 전혀 작동합니까? 주어진 인식 작업에 대한 https://cloud.google.com/speech/docs/basics#phrase-hintsGoogle 클라우드 음성 API 단어 힌트
에서
, 당신은 또한 주어진 오디오 처리에 도움이되는 정보를 제공합니다 (유형 SpeechContext의)는 speechContext를 전달할 수 있습니다. 현재 컨텍스트는 인식기에 "힌트"로 작용할 문구 목록을 보유 할 수 있습니다. 이러한 문구는 그러한 단어 나 문구가 인식 될 확률을 높일 수 있습니다.
당신은 몇 가지 방법으로이 문구 힌트를 사용할 수 있습니다 :
는 오디오 데이터에 과대 대표되는 경향이 있습니다 특정 단어 및 구문에 대한 정확도를 향상시킬 수 있습니다. 예를 들어 특정 명령이 일반적으로 사용자가 사용하는 경우 이러한 명령을 구문 힌트로 제공 할 수 있습니다. 이러한 추가 구문은 제공된 오디오에 잡음이 포함되어 있거나 포함 된 음성이 명확하지 않은 경우에 특히 유용 할 수 있습니다. 인식 작업의 어휘에 단어를 추가하십시오. Cloud Speech API에는 매우 큰 어휘가 포함되어 있습니다. 그러나 적절한 이름이나 도메인 별 단어가 어휘 밖인 경우 요청의 speechContext에 제공된 구에이를 추가 할 수 있습니다. 어구는 작은 단어 그룹 또는 한 단어로 제공 될 수 있습니다. (이 문구의 수와 크기에 대한 제한은 내용 제한을 참조하십시오.) 여러 단어로 제공되는 힌트는 순서대로 단어를 인식 할 확률을 높일뿐 아니라 그 정도를 줄이면 힌트의 일부를 인식 할 확률을 높입니다. 개별 단어를 포함한 구.
예를 들어,이 shwazil_hoful.flac 파일에는 구성된 단어가 포함되어 있습니다. 이러한 어휘 이탈 단어를 제공하지 않고 인식을 수행하면 인식자가 원하는 대본을 반환하지 않고 "하루 종일 삼키는 일"과 같이 어휘에 나오는 단어를 반환합니다. 이 밖으로의 어휘가 인식 요청과 함께 제공되는 경우
{
"config": {
"encoding":"FLAC",
"sampleRateHertz": 16000,
"languageCode":"en-US"
},
"audio":{
"uri":"gs://speech-demo/shwazil_hoful.flac"
}
}
그러나 인식기 원하는 성적 증명서를 반환합니다 : "그것은 shwazil hoful 날". 특정 단어가 일반적 구문 함께 상기 경우
{
"config": {
"encoding":"FLAC",
"sampleRateHertz": 16000,
"languageCode":"en-US",
"speechContexts": {
"phrases":["hoful","shwazil"]
}
},
"audio":{
"uri":"gs://speech-demo/shwazil_hoful.flac"
}
}
는 달리, 그들은 더가 인식 할 것이라는 확신을 높일 수있는, 함께 그룹화 될 수있다.
{
"config": {
"encoding":"FLAC",
"sampleRateHertz": 16000,
"languageCode":"en-US",
"speechContexts": {
"phrases":["shwazil hoful day"]
}
},
"audio":{
"uri":"gs://speech-demo/shwazil_hoful.flac"
}
}
일반적으로 음성 컨텍스트 힌트를 제공 할 때 절약하십시오. 문구가 말한 것으로 예상되는 것만으로 제한함으로써 더 나은 인식 정확도를 얻을 수 있습니다. 예를 들어 여러 대화 상태 또는 장치 작동 모드가있는 경우 항상 가능한 모든 상태에 대한 힌트를 제공하지 말고 현재 상태에 해당하는 힌트 만 제공하십시오.
감사합니다. –
@PavelPopov Google 음성 API에 원하는 힌트 단어가 포함 된 문구가 단순히 단어를 나타내는 것보다 더 나은 방식으로 작동한다는 것을 알았습니다. Api는 음성 인식 중에 주위의 단어가 힌트로 지정한 문구와 다른 경우에도 사용자 지정 단어를 더 성공적으로 감지 할 수 있습니다. – Josh