2014-11-25 2 views
0

오디오 데이터에서 사이렌을 감지하려고하는 응용 프로그램이 있습니다. 그러나 오디오 개념과 용어에 대한 이해는 초보적입니다.음조음 감지

내 응용 프로그램의 첫 번째 단계는 피치를 감지하는 것입니다. 창에

  • 분할 오디오 데이터를
  • 이 (버킷 0을 무시 지배적 인 주파수의 크기를 압축을 풉니 FFT
  • 를 사용하여 주파수 영역으로 각 창에있는 데이터를 변환 다음과 같이 나는이 구현 알고리즘입니다). 이것이 maxMag가되도록합시다
  • 모든 FFT 버킷에 대해 평균 크기를 추출합니다 (버킷 0 무시). 이것은 maxMag/meanMag> 어떤 임계 값의 경우
  • 을 meanMag 수하자, 다음 윈도우가 소리 쳤다 포함

이 알고리즘 메이크업 감각을합니까? 내 용어가 맞습니까?

감사합니다.

답변

0

단일 톤 (또는 작은 톤 세트)을 감지하는 경우 전체 FFT를 수행 할 필요가 없습니다. 을 사용하여 특정 톤을 감지 할 수 있습니다. 다른 모든 것에 비해 원하는 음색의 수준은 중요하지 않으므로 톤이 가장 클 경우에만 톤을 감지해야하는 이유가없는 한 "우세 주파수"테스트를 피할 수 있어야합니다 환경에서.