2011-09-19 6 views
0

저는 몇 달 전에 신호 처리를 처음 접한 학생입니다. 나는 내 프로젝트 ("다운로드 가능한 버전"을 위해 Google)에서 "음성 인식에 대한 새로운 퍼지 접근법"을 골랐다.MATLAB - 교육 데이터를 스펙트로 그램으로 변환하는 데 문제가 있습니다

필자는 훈련 데이터를 멜 필터를 통과 한 스펙트로 그램으로 변환하는 데 다소 시간이 걸렸습니다.

나는 약간의 수정을 통해 나의 멜 필터 뱅크에 this을 사용합니다.

p =25; 
fl =0.0; 
fh =0.5; 
w ='hty'; 
[a,fs]=wavread('a.wav'); %you can simply record a sound and name it a.wav, other param will follows 
n=length(a)+1; 
fa=rfft(a); 
xa=melbank_me(p,n,fs); %the mel-filterbank function 
za=log(xa*abs(fa).^2); 
ca=dct(za); 
spectrogram(ca(:,1)) 

내가 가진 모든 그냥 종이처럼되지 않는이처럼 말 ::

enter image description here

:

은 그 때 나는 내 훈련 데이터의 스펙트로 그램을 만들기 위해이 간단한 코드를 작성

내 코드 또는 내가 가지고있는 스펙트로 그 중 하나가 옳았다는 것을 알려주십시오. 그렇다면 종이처럼 내 스펙트로 그램을 만들기 위해 무엇을해야합니까? 그리고 그렇지 않다면, 어디서 잘못되었는지 말해주세요.

그리고 또 다른 질문은 FFT의 길이가 그렇게 길다는 것이 맞습니까? 코드를 내리려고하면 내 코드에 오류가 발생합니다.

+0

왜 mfcc coeffs의 스펙트로 그램을 복용하고 있습니까? mffc를 계산하는 마지막 단계는 dct를 취하는 것입니다. 스펙트로 그램 기능으로 무엇을 얻으려고하십니까? –

+0

실제로, 스펙트로 그램으로 mfcc 코드를 사용한다는 의미는 아니며, 멜 - 필터 뱅크를 통과 한 후 내 음성 샘플의 스펙트로 그램을 가져 가고 싶습니다. 코드가 잘못 되었습니까? 나는 그것을 마쳤다. 샘플 음성을 템플릿으로 만들려고합니다. 따라서 템플릿을 기반으로 퍼지 화 규칙을 만들 수 있습니다. – cuprum

+0

실제로 mfcc 코드를 스펙트로 그램으로 사용하지 않으려 고합니다. 멜 - 필터 뱅크를 통과 한 후에 내 음성 샘플의 스펙트로 그램을 가져 가면 내 코드가 잘못 됐습니까? 나는 그것을 마쳤다. 샘플 음성을 템플릿으로 만들려고하므로, 내가 만든 템플릿을 기반으로 퍼지 규칙을 만들 수 있습니다. 그 종이처럼. 그게 다야. – cuprum

답변

1

너무 많은 시간 정보를 포함하는 전체 파일의 FFT를 수행하지 않아야합니다. 사운드가 상대적으로 고정되어있는 창 크기를 선택해야합니다. 44.1kHz = 441 샘플에서 10ms이므로 아마도 N = 512가 좋은 출발점이 될 수 있습니다. 그러면 시간에 따라 변하는 주파수 내용을 표시하기 위해 필요할 경우 연속적인 창에서 스펙트로 그램을 생성 할 수 있습니다.

+0

고마워요, 그걸 시도 할게요. 그러면 내 스펙트로 그램 그림에 대해 설명해 주시겠습니까? 내 코드에 의해 생성 된 내 그림이 맞습니까? 그렇다면 추가 과정을 위해 어떻게해야 신문을 좋아하게 할 수 있습니까? 그리고 그렇지 않은 경우 어디에서 잘못 되었습니까? – cuprum

+0

종이에 대한 링크가 있습니까? –

+0

[ieee에서] (http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=1410027) [다운로드 가능한 버전] (http://www.google.co.id/url?sa=t&source= 웹 및 CD = 3 VED = 0CDUQFjAC & URL = HTTP % 3A % 2F % 2Fhome.cs.tum.edu % 2F ~ Ziaie의 % 2Ffiles % 2Fscientific_papers % 2FA % 2520Novel % 2520Fuzzy % 2520Approach % 2520to % 2520Speech % 2520Recognition.pdf 및 EI = U0N4TvvSNILprAeuseCNCw & USG = AFQjCNG42mmqTG_EY4Vqb5T92Z_4sgQP_w & SIG2 = qmebyhPmrJ3VyrbJCou6bQ) – cuprum