다음은 필자가 작성한 코드로, 멜 삼각형 필터 뱅크를 작성하려고합니다.분석 및 MFCC 용 FFT 신호용 필터
300 ~ 8000 Hz 범위에서 시작하여 주파수를 mels로 변환 한 다음 주파수로 되돌려서 fft_bin 수를 얻습니다.
clear all;
g=[300 8000]; % low freqncy and fs/2 for the highest frequency
freq2mel=1125*log(1+(g/700)); % creating mel scale from the frequency
% answer [401.25 2834.99]
f=linspace(0,2835,12); % if we want 10 filter banks that we use the
two endpoints and it will put 10 banks between them
% answer is [401.25 622.50 843.75 1065.0 1286.25 1507.50 1728.74
1949.99 2171.24 2392.49 2613.74 2834.99]
mel2freq=700*(exp(f/1125)-1); % converting the mel back into frequency
%answer is [300 517.33 781.90 1103.97 1496.04 1973.32 2554.33
3261.62 4122.63 5170.76 6446.70 8000]
fft_bins=floor((mel2freq/16000)*512); % creating fft bins
%answer is [9 16 25 35 47 63 81 104 132 165 206 256]
내 문제는 이것입니다. 나는 이것 후에 붙어있다. 나는 아래의 필터 뱅크 piecewise 함수가 계속 나오는 것을 보았습니다. 그러나이 함수에 K가 무엇인지 이해하지 못합니다. k는 해밍 창에서 $$ \ mid (FFT) \ mid^2 $$의 배열입니까? 내 MFCC를 얻기 위해 1의 크기를 가진 삼각 출력을 가진 실제 필터를 $ \ mid (FFT) \ mid^2 $를 전달하는 방법. 누군가 나를 도울 수 있습니까? 당신이 이러한 종류의 필터링을 수행 할 때