0
오디오 데이터에서 사이렌을 감지하려고하는 응용 프로그램이 있습니다. 그러나 오디오 개념과 용어에 대한 이해는 초보적입니다.음조음 감지
내 응용 프로그램의 첫 번째 단계는 피치를 감지하는 것입니다. 창에
- 분할 오디오 데이터를
- 이 (버킷 0을 무시 지배적 인 주파수의 크기를 압축을 풉니 FFT
- 를 사용하여 주파수 영역으로 각 창에있는 데이터를 변환 다음과 같이 나는이 구현 알고리즘입니다). 이것이 maxMag가되도록합시다
- 모든 FFT 버킷에 대해 평균 크기를 추출합니다 (버킷 0 무시). 이것은 maxMag/meanMag> 어떤 임계 값의 경우
- 을 meanMag 수하자, 다음 윈도우가 소리 쳤다 포함
이 알고리즘 메이크업 감각을합니까? 내 용어가 맞습니까?
감사합니다.