2012-02-22 2 views
5

두 단어의 .wav 파일을 비교하고 동일한 단어 (동일한 순서도 포함)가 있는지 비교해야합니다.Python Speech Compare

나는 지금 가장 좋은 방법을 찾고 있습니다. 나는 말소리를 입력으로 사용하는 방법을 알아낼 수 없다. 나는 CMU 스핑크스 프로젝트를 작동 시키려고 노력했지만, GStreamer가 Python 27로 작업하게 만들지는 않았다. 드래곤 플라이도 운이 좋지 않은 곳에서 놀았습니다.

저는 Win7 64 비트를 Python27과 함께 사용하고 있습니다. 누구든지 아이디어가 있습니까?

도움을 주시면 대단히 감사하겠습니다.

+0

걸릴 수 있습니다 [dsp.se] – Daenyth

답변

4

PySpeech을 시도해 볼 수 있습니다. 자세한 내용은 pyspeech (python) - Transcribe mp3 files?을 참조하십시오. 필자는 이것을 사용한 적이 없지만 Windows의 내장 된 음성 인식 엔진을 사용한다고 생각합니다. 이렇게하면 Wav 파일을 텍스트로 변환 한 다음 텍스트 비교를 수행 할 수 있습니다.

Windows 음성 엔진을 사용하고 wav 파일을 입력하려면 두 가지 요구 사항이 있습니다.

  1. inproc 인식기 (SpeechRecognitionEngine)를 사용하십시오. 공유 인식기는 Wav 파일을 입력으로 사용할 수 없습니다.
  2. 인식기 개체에서 입력 wav 파일을 지정하려면 SetInputToWaveFile을 호출하십시오.

음성 인식 엔진이 특정 샘플 속도 만 지원하기 때문에 wav 파일을 다시 샘플링해야 할 수 있습니다. 샘플 당

  • 8 비트

잘 작동 윈도우에 제

  • PCM 인코딩 당
  • 단일 채널 모노
  • 22,050 샘플. 자세한 내용은 https://stackoverflow.com/a/6203533/90236을 참조하십시오.

    창문 음성 엔진에 좀 더 배경에 대한

    , 당신은 당신이 볼 수있는 SAPI and Windows 7 Problem보고 What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?