2017-10-19 18 views
0

오디오 파일을 녹음하기 위해 포켓 스핑크스를 사용하려고합니다. Download from GitHub예상 오디오 샘플 속도가 실제와 일치하지 않습니까?

결국 내가 좋아하는 오디오 파일의 5 시간 이상을 일괄 전사됩니다

ERROR: "continuous.c", line 136: Input audio file has sample rate [44100], 
     but decoder expects [16000] 
FATAL: "continuous.c", line 165: Failed to process file '116-288045-0005.flac.wav' 
     due to format mismatch. 

여기에 내가 전사하는 데 필요한 오디오 파일 중 하나입니다 :

pocketsphinx_continuous -infile 116-288045-0005.flac.wav 

는하지만 오류를 얻고있다 이들은 현재 모두 동일한 오류를 발생시킵니다.

여기

내가 전사하기 위해 노력하고있어 같은 파일의 일부 통계의 :

$ soxi 116-288045-0000.flac.wav 

Input File  : '116-288045-0000.flac.wav' 
Channels  : 1 
Sample Rate : 44100 
Precision  : 16-bit 
Duration  : 00:00:10.65 = 469665 samples = 798.75 CDDA sectors 
File Size  : 939k 
Bit Rate  : 706k 
Sample Encoding: 16-bit Signed Integer PCM 

이 파일의 구성의 일부에 문제가있을 수 있습니다, 나는 MP3 파일로 병합하는 몇 가지 사전 처리를 완료했습니다 flac에서 wav로 변환 할 수 있습니다.

지금 내가 가장 쉬운 방법은 무엇일까요?

파일을 다시 16kHz로 다시 샘플링하지 않고도 가능합니까? 원래 flac 파일의 샘플 속도는 16kHz 였지만 44.1kHz mp3 파일과 병합해야했습니다. 따라서 16k로 리샘플링하면 손실 될 수있는 고주파 정보가 이제는 있습니다.

답변

1

오디오를 16000 샘플로 다시 샘플링 한 다음 다시 시도하십시오.


sox file.wav -r 16000 file-16000.wav

+0

처럼 재 샘플링 할 수 있습니다하지만 그 정보를 제거한다. 무슨 일이 있었는지'.flac' 파일은 원래 16000Hz이지만, 44.1kHz mp3 파일과 병합해야했습니다. 따라서 16k로 리샘플링하면 손실 될 수있는 고주파 정보가 있습니다. – theonlygusti

+0

16kHz로 리샘플링하지 않고 어떻게해야합니까? – theonlygusti

+0

또 다른 옵션은 구성 파일을 수정하고 디코더의 기본 샘플링 속도를 변경하는 것입니다. config의 옵션 이름은'-samprate'입니다. – deimus