2014-10-04 2 views
0

아랍 문자를 인식하는 모델을 만들고 싶습니다. 언어 모델과 사전 파일을 만드는 방법을 알고 있지만 어쿠스틱 모델에 머물러 있습니다. 각 편지에 대해 wav 파일을 기록하지만 훈련 중에는 훈련이 계속되는 동안 훈련 시간이 너무 짧다 고합니다. 모델을 사용하려고하면 모델이 아무것도 인식하지 못합니다 (null을 제공함).어쿠스틱 모델 시간 수

내가 wav 파일을 어떻게 녹음해야하는지 알고 싶습니다. 예를 들어, Alif과 같은 파일을 하나의 wav 파일에서 100 번 반복하거나 동일한 문자의 여러 wav 파일 만 녹음해야합니다.

귀하의 도움에 감사드립니다.

답변

1

내가 wav 파일을 어떻게 녹음해야하는지 알고 싶습니다. 예를 들어 편지 Alif를 하나의 wav 파일에 100 번이나 반복해야합니다. 아니면 같은 편지의 여러 wav 파일을 녹음해야합니까?

문자가 아닌 연속적인 단어가있는 파일이 여러 개있는 것이 좋습니다. 편지는 알아보기가 어렵습니다.

사용하려고하면 모델에서 아무것도 인식하지 못합니다 (null).

여기에는 여러 가지 문제가있을 수 있습니다 (잘못된 오디오 형식 등). Dropbox를 사용하여 CMUSphinx 포럼에서 데이터베이스를 공유하면이 문제에 대한 도움을받을 수 있습니다.

+0

그러나 내 응용 프로그램은 문자를 인식하는 것이므로 제안을 사용하면 언어 모델에서 문자 대신 단어를 사용할 것이므로 문자를 인식 할 수있는 방법이 없습니다. 그러면 내 모델은 어떻게 생겼을까요? – coding4fun

+0

글자 대신 단어를 인식하도록 응용 프로그램을 다시 디자인하십시오. 글자는 현재의 기술 상태에서 인식하기가 어렵습니다. 예를 들어 영어의 경우 RADIO 알파벳이 "ALPHA, BRAVO, CHARLIE, DELTA ...."문자 대신 사용됩니다. –