2014-12-12 12 views
2

그냥 일반적인 연구를하고 있습니다. 다음을 수행하는 오픈 소스 (또는 유료) 도구/프로그램이 있습니까?사전없이 비언어적 인 음성 인식을위한 오픈 소스 도구

INPUT : 레이블이 지정되지 않은 일부 오디오 파일, 어쩌면 몇 문장 길이의 음성 파일 (음성 표기가 무엇인지 표시되지 않음) 오디오)

출력 : IPA의 alphebet에서 음성 녹음 방송과 오디오 파일() 정렬 및 오디오

에 표시된 그냥 음성 사전으로하고, 단어 사전없이 할이 수 있습니까?

답변

1

스핑크스는 이러한 종류의 출력 가설을 생성하는 모든 전화 기능을 가지고 있습니다. 그러나 대부분의 음성 인식은 음운 사전과 n-gram 언어 모델을 사용하여 강력하게 개선됩니다. 가설 작성에 이러한 것들을 사용하여 스핑크스와 함께 레이블이있는 정렬 음소로 변환 할 수 있습니다.

다음은 단지 소리 나는 내용의 예입니다.

http://cmusphinx.sourceforge.net/wiki/phonemerecognition

그러나 나는 오랜 시간 동안 음성 녹화 게임에서왔다. 나는 대부분의 사람들이 이러한 종류의 개념을 위해 신경망을 추구하고 있으며 그 공간에서 열린 신경망을 알지 못한다고 믿습니다.