우리는 서버 측 프로세스에서 들어오는 라이브 제어되지 않은 녹음의 다양한 웨이브 파일을 가지고 있으며 대부분은 전반적으로 선명한 음성을 제공합니다. 그러나 때로는 왜곡되거나, 정적이거나, 음성 볼륨이 충분하지 않습니다. C#을 사용하여 녹음이 "좋은"품질로 간주되는지 여부를 결정하는 효율적인 방법이 있습니까? 녹음 음질을 효율적으로 검사하는 방법
내가 알고있는 좋은 녹음의 스펙트로 그램을 복용하고 나쁜 기록의 스펙트로 그램에 비해 생각하지만 녹음 할 때마다 그래서이 작동하지 않을 수 있습니다 다른 말을해야합니다. Bass.Net 및 NAudio와 같은 라이브러리를 살펴 보았지만 오디오 프로세싱은 전문 분야가 아닙니다.나는 audio fingerprints을 비교해 볼 수는 있지만, 어떻게 작동하는지 완전히 모르겠습니다. 누군가가 오디오 지문 해시와 Levenshtein Distance 알고리즘을 사용하여 두 개의 오디오 파일을 비교하려고 시도하여 두 오디오 파일 간의 유사성 정도를 확인했습니다. 오디오 지문에 의해 생성 된 해시가 유사한 오디오 파일간에 유사하지 않으면이 방법이 작동하지 않습니다.
또 다른 생각은 음성을 처리하고 오디오의 사본을 텍스트 파일에 쓰려고 시도하기 위해 일종의 음성 인식 API를 사용하는 것이 었습니다. 문제는 음성 인식이 매우 정확하지 않고 Microsoft의 Speech API와 같은 API가 왜곡 된 녹음 또는 정적 인 소리가있는 경우에도 음성을 인식하려고 시도 할 수 있다는 것입니다. Nuance에 SDK 버전의 음성 인식 소프트웨어가 있지만 SDK를 시험 할 기회가 없었습니다. SDK의 시험 버전을 웹 사이트에 제공하지 않는 것 같아서.
입니다 VST 플러그인 (수천 가지가 있음). –
그 제안에 감사드립니다. 나는 이것을 곧 조사 할 것이다. 현재로서는 오디오 처리의 필요성을 보류하고 있습니다. –