2011-09-11 3 views
1

CMU SLM 툴킷을 사용하여 텍스트 파일에서 ARPA 파일을 만들었습니다.음성 인식에서 arpa 파일을 사용하는 방법

현재 .lm.dic 파일 대신 내 프로젝트에서 생성 된 ARPA 파일을 사용하는 방법을 모르겠습니다.

아무도 알려 주시면 알려주세요.

+0

인사하는 방법을 아직 .lm 파일을 생성에 갇혀 사전 file.am을 만들 수 있도록 주시기 바랍니다 나 .dic과 .lm file.thanks를 만드는 과정을 안다. 미리. – ravoorinandan

답변

3

검색에서 단어 전환의 "비용"을 고려할 때 언어 모델의 확률을 사용합니다. :-)하지만 그건 당신이 듣고 싶지 않았을 것입니다.

귀하의 질문은 너무 개방적입니다 .. 당신의 구체적인 문제는 무엇입니까?

사전과 언어 모델은 두 개의 개별 항목으로, 하나를 다른 것으로 변환 할 수 없습니다.

사전은 유효한 단어가 무엇인지, 그리고 그들이 음소/소리 나는 표어와 어떻게 관련되어 있는지 검색에 알리는 데 사용됩니다.

언어 모델은 검색 알고리즘이 단어 전이를 고려하고있을 때, 유니 그램, 바이 그램, n 그램의 확률을 사용하여 발화를 인식하는 동안 사용됩니다.

편집 :

검사 :

http://www-speech.sri.com/projects/srilm/manpages/ngram-format.5.html

http://www.ee.ucla.edu/~weichu/htkbook/node243_ct.html

http://www.ling.ohio-state.edu/~bromberg/ngramcount/ngram2fsm.html

+0

답장을 보내 주셔서 감사합니다 tilo.yes 나는 .dic과 .lm이 모두 다르다는 것을 알고 있습니다. 현재 저는 slmtools.but을 사용하여 corpus.txt 파일에서 .arpa 파일을 생성했습니다. 제 질문은 .arp 형식을 .lm 형식으로 변환하는 방법입니다. .? 사전 파일을 만드는 것은 그 둘을 섞어서 미안하다는 별도의 질문입니다. – ravoorinandan

+1

나는 내 대답에 .. 행운을 빌어 요! – Tilo

+0

정말 고마워요. :) – ravoorinandan