2014-07-14 2 views
1

오보 오 (또는 다른 유사한 서비스)가 우리 사업에 적합한 지 조언 해 줄 수 있는지 궁금합니다. 슬프게도 나는 개발자 또는 사운드 엔지니어가 아니므로 내 무지를 용서해주십시오 ...하지만 모든 의견을 많이 부탁드립니다!갭이나 일시 중지 중에 오디오 파일을 슬라이스/태그하는 방법은 무엇입니까? 오우 보?

현재 오디오 파일 (예 : 회의 녹음 1 시간)을 오디오의 짧은 부분으로 잘라냅니다. 이 문제는 오디오가 해부되는 잔인한 방법입니다. 60 분짜리 파일을 5 분짜리 섹션으로 자르면 매 5 분마다 단어 나 문장이 절반으로 잘려져 품질이 떨어질 수 있습니다. 청취자가 하프/문장을 해독 할 수 없기 때문에 품질이 떨어질 수 있습니다.

나는 aubio 사이트의 기능 중 하나를 "각 공격 전에 사운드 파일을 분할하는 것"으로 나열한다는 것을 알 수 있습니다. 우리 오디오 파일을 더 잘 분할하는 데 오보 오 (aubio) 또는 유사한 것을 사용할 수 있는지 궁금합니다. 우리는 중간 단어 대신 갭이나 일시 정지 중에 오디오 파일을 슬라이스/태그 할 수 있기를 원합니다.

조언을 주시면 감사하겠습니다.

종류는 당신이 구글에서 검색하는 경우가 많은 프로그래밍되는 언어의 선진들에 대한 간단한에서 많은 구현을 찾을 수 톰

답변

2

에게 "음성 활동 감지"이라고 침묵을 감지 할 수있는 알고리즘을 간주한다. 예를 들어, 당신은 http://cmusphinx.sourceforge.net에서 sphinxbase 라이브러리를 다운로드 할 수 있습니다 청크에 세그먼트 파일에 포함 된 도구 sphinx_cont_fileseg를 사용 : 다른 구현도 있습니다

sphinx_cont_fileseg -i file.wav -w 

. 지금까지 보았 듯이 aubio는 VAD 구현을 가지고 있지 않지만 아마도 aubio 클래스를 사용하여 구축 할 수 있습니다. Aubio는 음악 분석에 더 많은 표적이되고 음성에는 적고 VAD 구현은 포함되지 않습니다.

일단 침묵을 감지하면이를자를 수 있습니다. 구현하는 것은 간단합니다. 그래도 개발자를 찾을 가치가 있습니다.