2017-03-24 9 views

답변

3

, 당신은 또한 주어진 오디오 처리에 도움이되는 정보를 제공합니다 (유형 SpeechContext의)는 speechContext를 전달할 수 있습니다. 현재 컨텍스트는 인식기에 "힌트"로 작용할 문구 목록을 보유 할 수 있습니다. 이러한 문구는 그러한 단어 나 문구가 인식 될 확률을 높일 수 있습니다.

당신은 몇 가지 방법으로이 문구 힌트를 사용할 수 있습니다 :

는 오디오 데이터에 과대 대표되는 경향이 있습니다 특정 단어 및 구문에 대한 정확도를 향상시킬 수 있습니다. 예를 들어 특정 명령이 일반적으로 사용자가 사용하는 경우 이러한 명령을 구문 힌트로 제공 할 수 있습니다. 이러한 추가 구문은 제공된 오디오에 잡음이 포함되어 있거나 포함 된 음성이 명확하지 않은 경우에 특히 유용 할 수 있습니다. 인식 작업의 어휘에 단어를 추가하십시오. Cloud Speech API에는 매우 큰 어휘가 포함되어 있습니다. 그러나 적절한 이름이나 도메인 별 단어가 어휘 밖인 경우 요청의 speechContext에 제공된 구에이를 추가 할 수 있습니다. 어구는 작은 단어 그룹 또는 한 단어로 제공 될 수 있습니다. (이 문구의 수와 크기에 대한 제한은 내용 제한을 참조하십시오.) 여러 단어로 제공되는 힌트는 순서대로 단어를 인식 할 확률을 높일뿐 아니라 그 정도를 줄이면 힌트의 일부를 인식 할 확률을 높입니다. 개별 단어를 포함한 구.

예를 들어,이 shwazil_hoful.flac 파일에는 구성된 단어가 포함되어 있습니다. 이러한 어휘 이탈 단어를 제공하지 않고 인식을 수행하면 인식자가 원하는 대본을 반환하지 않고 "하루 종일 삼키는 일"과 같이 어휘에 나오는 단어를 반환합니다. 이 밖으로의 어휘가 인식 요청과 함께 제공되는 경우

{ 
    "config": { 
    "encoding":"FLAC", 
    "sampleRateHertz": 16000, 
    "languageCode":"en-US" 
    }, 
    "audio":{ 
    "uri":"gs://speech-demo/shwazil_hoful.flac" 
    } 
} 

그러나 인식기 원하는 성적 증명서를 반환합니다 : "그것은 shwazil hoful 날". 특정 단어가 일반적 구문 함께 상기 경우

{ 
    "config": { 
    "encoding":"FLAC", 
    "sampleRateHertz": 16000, 
    "languageCode":"en-US", 
    "speechContexts": { 
     "phrases":["hoful","shwazil"] 
    } 
    }, 
    "audio":{ 
    "uri":"gs://speech-demo/shwazil_hoful.flac" 
    } 
} 

는 달리, 그들은 더가 인식 할 것이라는 확신을 높일 수있는, 함께 그룹화 될 수있다.

{ 
    "config": { 
    "encoding":"FLAC", 
    "sampleRateHertz": 16000, 
    "languageCode":"en-US", 
    "speechContexts": { 
     "phrases":["shwazil hoful day"] 
    } 
    }, 
    "audio":{ 
    "uri":"gs://speech-demo/shwazil_hoful.flac" 
    } 
} 

일반적으로 음성 컨텍스트 힌트를 제공 할 때 절약하십시오. 문구가 말한 것으로 예상되는 것만으로 제한함으로써 더 나은 인식 정확도를 얻을 수 있습니다. 예를 들어 여러 대화 상태 또는 장치 작동 모드가있는 경우 항상 가능한 모든 상태에 대한 힌트를 제공하지 말고 현재 상태에 해당하는 힌트 만 제공하십시오.

+0

감사합니다. –

+0

@PavelPopov Google 음성 API에 원하는 힌트 단어가 포함 된 문구가 단순히 단어를 나타내는 것보다 더 나은 방식으로 작동한다는 것을 알았습니다. Api는 음성 인식 중에 주위의 단어가 힌트로 지정한 문구와 다른 경우에도 사용자 지정 단어를 더 성공적으로 감지 할 수 있습니다. – Josh