저는 Cognitive Services (Project Oxford) Bing Speech Recognition 서비스에 Microsoft의 C# API를 사용하고 있습니다. 특히 Microsoft.ProjectOxford.SpeechRecognition-x64 버전 0.4.10.2를 사용하고 있습니다.음성 인식 결과를 발화와 연관시키는 보장 된 방법은 무엇입니까?
은 내가 SendAudio
및 EndAudio
방법을 사용하여 DataRecognitionClient
오디오를 전송하고, OnResponseReceived
이벤트를 통해 인식 가설의 최종 세트를 기다립니다. 현재 진행중인 문제는 두 개 이상의 잔여 인식 요청을 쉽게 가질 수 있고 OnResponseReceived
처리기에 전달 된 SpeechResponseEventArgs
개체에 어떤 요청이 응답인지 알려주는 정보가 포함되어 있지 않다는 것입니다.
- 사람이 말 호출, 무언가를 말한다, 나는
SendAudio
로 보내 그들이 말하는 완료되면 다음EndAudio
전화 :다음은 실제로 여러 번 나에게 일어난 예입니다.
OnResponseReceived
사건의 발언 A를 기다리는 동안, 다른 사람이 다른 말을하고, 그것을 B라고 부릅니다. 다시SendAudio
을 통해 신고 한 다음 이야기가 끝나면EndAudio
으로 전화하십시오. 나는 아직OnResponseReceived
이벤트를받지 못했습니다.- 마침내 내 첫 번째
OnResponseReceived
이벤트가 발생합니다. - 두 번째로
OnResponseReceived
이벤트가 발생합니다.
어떻게 응답을 발언에 올바르게 연결할 수 있습니까?
내가 A와 B의 발언을 보내면 항상 발언 A에 대한 응답을 얻을 수 있도록 주문 보증이 있습니까? 문서에서 그 보증을 보지 못했습니다.
매번 스피치 - 투 - 텍스트가 정확히 정확함을 보장 할 수있는 방법이 있습니까? – EJoshuaS
@EJoshuaS 아니요. OP는 올바른 응답이 올바른 음성 입력과 어떻게 관련되는지 확인하려고합니다. 문제는'onResponseReceived' 핸들러를 사용하여 어떤 응답이 어떤 연설로 조정되는지를 모른다는 것입니다. –