2013-08-14 4 views
0

우리는 서버 측 프로세스에서 들어오는 라이브 제어되지 않은 녹음의 다양한 웨이브 파일을 가지고 있으며 대부분은 전반적으로 선명한 음성을 제공합니다. 그러나 때로는 왜곡되거나, 정적이거나, 음성 볼륨이 충분하지 않습니다. C#을 사용하여 녹음이 "좋은"품질로 간주되는지 여부를 결정하는 효율적인 방법이 있습니까? 녹음 음질을 효율적으로 검사하는 방법

내가 알고있는 좋은 녹음의 스펙트로 그램을 복용하고 나쁜 기록의 스펙트로 그램에 비해 생각하지만 녹음 할 때마다 그래서이 작동하지 않을 수 있습니다 다른 말을해야합니다. Bass.Net 및 NAudio와 같은 라이브러리를 살펴 보았지만 오디오 프로세싱은 전문 분야가 아닙니다.

나는 audio fingerprints을 비교해 볼 수는 있지만, 어떻게 작동하는지 완전히 모르겠습니다. 누군가가 오디오 지문 해시와 Levenshtein Distance 알고리즘을 사용하여 두 개의 오디오 파일을 비교하려고 시도하여 두 오디오 파일 간의 유사성 정도를 확인했습니다. 오디오 지문에 의해 생성 된 해시가 유사한 오디오 파일간에 유사하지 않으면이 방법이 작동하지 않습니다.

또 다른 생각은 음성을 처리하고 오디오의 사본을 텍스트 파일에 쓰려고 시도하기 위해 일종의 음성 인식 API를 사용하는 것이 었습니다. 문제는 음성 인식이 매우 정확하지 않고 Microsoft의 Speech API와 같은 API가 왜곡 된 녹음 또는 정적 인 소리가있는 경우에도 음성을 인식하려고 시도 할 수 있다는 것입니다. Nuance에 SDK 버전의 음성 ​​인식 소프트웨어가 있지만 SDK를 시험 할 기회가 없었습니다. SDK의 시험 버전을 웹 사이트에 제공하지 않는 것 같아서.

+1

입니다 VST 플러그인 (수천 가지가 있음). –

+0

그 제안에 감사드립니다. 나는 이것을 곧 조사 할 것이다. 현재로서는 오디오 처리의 필요성을 보류하고 있습니다. –

답변

0

기존 오픈 소스 도구를 사용하여 시끄러운 음성에 대한 SNR을 측정 할 수 있습니다. 자세한 내용은 http://labrosa.ee.columbia.edu/projects/snreval/

를 참조하십시오 당신이 세계 반 도핑기구 SNR

http://www.cs.cmu.edu/~robust/archive/algorithms/WADA_SNR_IS_2008/

그것은 꽤 간단한 알고리즘이다 그러나 그것은 스스로를 설계하는 사소한 아니에요을 시도하는 것이 좋습니다.

지문 인식과 ASR은 감지하지 못하도록 노이즈를 제거하려고하므로 확실하게 작동하지 않습니다.

는 .. IMO 당신의 가장 좋은 방법은 다양한 통해 사운드를 실행하는 C#에서 응용 프로그램을 호스팅 VST 쓰기 다음 VST 플러그인을 연구하고 당신은 일이 알고리즘 노이즈 플로어, 동적 범위, RMS 출력 등을 결정하고자 할 수