2017-11-16 12 views
-1

나는 음성 인식과 음성 합성 (가상 아바타)을 사용하여 사람과 상호 작용하는 프로그램을 만들고있다. 사용자는 아바타와 대화 할 수 있습니다. 또한, 프로그램은 사용자가 원격 조작자와 대화 할 수있는 원격 모듈을 갖는다. 원거리 운영자는 아바타를 통해 대화를 나눕니다.음성을 텍스트로 변환 한 다음 텍스트를 음성으로 변환

우리가 현재하고있는 일은 원격 모듈의 텍스트로 변환 한 다음 텍스트를 주 모듈로 보낸 다음 텍스트를 음성으로 변환하고 그 반대의 경우도 마찬가지입니다. 그러나이 메시지가 길어지면 대기 시간이 길어집니다 (모든 음성을 인식 한 후에 만 ​​텍스트를 보내고 음성으로 변환 할 수 있습니다). 따라서 사용자와 원격 운영자 간의 대화가 원활하지 않습니다 (사용자는 다른 사람이 이야기하고 있다는 사실을 깨닫지 않아야합니다. 아바타가 사용자와 대화하는 것처럼 나타나야하므로 대기 시간이 길어서는 안됩니다)

이것을 C# .NET에서 구현할 수 있습니까? 누구든지 이것을 달성하는 방법을 알고 있습니까?

답변

1

Microsoft인지 서비스를 확인해 보겠습니다.

음성 클라이언트 라이브러리 : 음성 인식에 지원 고급 기능 등을 실시간으로 중간 결과로

https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home

그들은 당신이 찾고있는 결과를 실시간으로 제공하는 네이티브 클라이언트를 제공 , 긴 오디오 스트림 (최대 10 분) 및 연속 인식. 원하는 언어로 간단하고 관용적 인 API를 제공하십시오. 낮은 수준의 통신 세부 정보를 숨 깁니다. 현재

, 다음과 같은 음성 클라이언트 라이브러리를 사용할 수 있습니다

  • C# 바탕 화면 라이브러리
  • C# 서비스 라이브러리
  • 안드로이드를위한 자바 스크립트 라이브러리
  • 자바 라이브러리
  • 목표 - C 라이브러리 iOS 용
https://github.com/Azure-Samples/Cognitive-Speech-STT-Windows

출처 : https://docs.microsoft.com/en-us/azure/cognitive-services/speech/getstarted/getstartedclientlibraries

16,

C# 데스크톱 라이브러리 샘플에서 구할 수 있습니다