2009-11-20 5 views
4

.NET 음성 인식 클래스를 사용하여 응용 프로그램을 작성하고 WAV 파일을 전달하여 텍스트 설명을 생성 할 수 있습니까? 예를 들어, 내가 뭘 하려는지 :.NET의 음성 인식 클래스에 대한 질문

우리 사무실에는 QA 부서가 있으며, 하루에도 수백건의 전화를 듣지 않아도되고, 유지할 모든 것을 듣는 사람들이 충분하지 않습니다. 쪽으로. 내가하고 싶은 일은 오디오 파일을 우리 서버에 업로드하고 서버가 그것을 분석하고 그 사본을 만드는 것입니다. 완벽하지는 않지만 중요하지 않지만 2 시간짜리 녹음을 듣는 것보다 몇 줄의 텍스트를 더 쉽게 훑어 볼 수있는 기반이됩니다.

저장 한 성적표를 토대로 데이터베이스에서 전체 텍스트 검색을 구현할 수 있으며 누군가가 허위 진술을 말하면 내용을 확인합니다.

그래서 .NET 음성 인식 클래스를 사용하여 응용 프로그램을 만들고 WAV 파일을 전달하면 거친 사본이 나올 수 있습니까?

아이디어를 생각하면서 Speech 수업에서 MSDN을 간단히 파헤 봤기 때문에 가능한 많은 지식이 없습니다.

가능하면 C#의 예를 들어 주시면 감사하겠습니다. 주제 1055347은 제가 가지고있는 질문과 유사하며 링크가 제공되었습니다. 가장 구체적인 것은 C++입니다. 나는 C++ 개발자가 아니며 프로그래밍을 위해 학교에 다녔지도 않고 C#이지만 모든 언어로되어 있으므로 내가 아는 언어로 머물고 싶습니다.

미리 감사드립니다.

답변

0

음성 인식과 같은 영역에서는 c/C++에서 독립형 EXE 또는 API를 찾을 가능성이 큽니다.

다른 주제의 링크는 P Interop Assistant과 같은 도구를 사용하여 C# 코드를 생성 할 수 있습니다. C# 코드는 관리되지 않는 dll에 대한 래퍼처럼 동작하므로 C#에서 호출 할 수 있습니다.

찾고있는 기능을 얻는 데 가장 좋은 방법 일 수 있습니다.

0

예.

몇 년 전에 태블릿 PC에서 그런 응용 프로그램을 만들었습니다. http://web.archive.org/web/20060615192119/www.devx.com/TabletPC/Article/30761에서 읽을 수 있습니다 (당시에 Interop을 사용하여 라이브러리에 액세스 할 수 있었지만 프로그래밍 모델은 관리되는 래퍼와 동일하게 유지되었다고 생각합니다.)

결과는 매우 가난했지만, 아마도 당신이 사용하는 것보다 더 나은 것보다 낫습니다.

2

콜 센터 유형의 응용 프로그램처럼 들립니다. Microsoft Speech Server에는 텔레포니 (8000 Hz 샘플 속도)에 최적화 된 SR 엔진이있어 데스크탑 SR 엔진보다 훨씬 뛰어난 인식을 생성합니다. 그러나 엔진은 실제로는 전사 용으로 설계되지 않았지만 (입니다.) 추가 처리가 수행되기 전에 전사 기록을 확실히 검토해야합니다. Microsoft Exchange Unified Communications는 SR 엔진을 사용하여 음성 메일의 성적표를 생성하며, 아무런 이점도없는 반면 재미있는 말도 안되는 소리를 생성합니다.

0

Google Voice으로 전화를 겁니다. 비슷한 서비스가 있다고 확신합니다. 지금까지의 정확성에 놀라움을 금치 못했습니다. 필요에 따라 클릭하고들을 수 있습니다. Google 보이스는 음성 통화를 SMS 또는 이메일로 전달합니다.

업데이트 : 다시 읽으면 음성 녹음이 끝나고 나면 음성 메시지가 남아있는 것처럼 작동하지 않습니다.