2

사용자가 읽은 오디오 샘플의 인토네이션 (자신의 목소리의 음조의 상승 및 하강)을 그래프로 표시 할 수있는 iOS 앱을 만들고 싶습니다. 인토네이션은 전 세계적으로 다양한 언어에서 매우 중요하며 이는 발음뿐만 아니라 억양도 연습하려는 시도입니다.음성 샘플의 인토네이션을 어떻게 그래프로 나타낼 수 있습니까?

저는 음성/오디오 기술에 익숙하지 않으므로 무엇이 필요합니까? 음성 샘플에서 필요한 데이터에 액세스 할 수있는 기능을 제공하는 Cocoa-touch와 함께 설치된 라이브러리가 있습니까? 내가 정확히 무엇을 잡으려고 할 것인가?

누구나 내가 활용해야하는 기술에 대한 아이디어가 있다면, 올바른 방향으로 한 점을 높이 평가할 것입니다.

감사합니다.

답변

1

찾고있는 것은 포만 트 분석입니다.

포먼트는 본질적으로 발화 된 소리의 스펙트럼 피크입니다. f1, f2와 같이 빈도 순으로 나열됩니다. 음모를 꾸미는 것이 f1이라고 생각됩니다.

포만 트 분석은 음성 인식의 핵심이며 대개 f1과 f2는 모음을 구별하기에 충분합니다. 나는 당신이 포먼트 분석 알고리즘에 대한 검색을하고 거기에서 가져갈 것을 권합니다.

행운을 빌어 요.