2017-05-22 10 views
2

gRPC를 통한 음성 인식을 위해 Assistant SDK의 Python 라이브러리를 사용하고 있습니다. 나는 음성 인식 \googlesamples\assistant\__main__.py에서 방법 resp.result.spoken_request_text를 호출 문자열로 반환하고 나는 그것이 가능한 경우 내가 알고 싶습니다 \googlesamples\assistant\__main__.pyGoogle 어시스턴트에서 오디오 스트림이 아닌 문자열로 응답받는 방법

에서 또한 방법 resp.audio_out.audio_data와 보조 API에서 오디오 스트림으로 대답을했다 (서비스 정의에서 사용 가능하거나 포함될 수 있기를 희망하는) 문자열로 서비스의 응답을 얻고, 문자열에 대한 액세스/요청 방법.

미리 감사드립니다.

답변

5

현재 (Assistant SDK Developer Preview 1),이를 수행하는 직접적인 방법은 없습니다. 아마도 오디오 스트림을 Speech-to-Text 시스템에 공급할 수는 있지만 실제로는 어리석은 짓을 시작합니다.

Google I/O에서이 주제에 대한 엔지니어들과 이야기하면서 끝까지 기술적 인 문제가 있음을 지적했지만 사용 사례를 이해합니다. 사람들이이 기능을 원한다는 것을 알기 위해 이런 질문을해야합니다.

곧 출시 예정인 개발자 미리보기에 추가되기를 바랍니다.

+0

답장을 보내 주셔서 감사합니다. 텍스트에 대한 쿼리 번역을 얻기 위해 Assistant에 반환 된 오디오 스트림을 피드하는 방법에 대해 생각했습니다.하지만 바보가되기 시작했다고 말한 것 같습니다. 비효율적입니다. 파이썬에서 gRPC를 사용하여 Google Could Platform의 Speech API와 통신하여 오디오 스트림을 처리 했습니까? – Towerss

+0

별도의 질문으로하는 것이 가장 좋습니다. – Prisoner