저는 HMM 기반 접근 방식을 사용하여 현지 언어 용 신시사이저를 만드는 프로젝트를 진행하고 있습니다. 지금까지 HTK Book에서 설명한대로 정렬 된 정렬 파일 (aligned.mlf)을 생성 할 수있었습니다. 그러나 HTS를 사용하여 신시사이저를 만드는 방법에 대한 단계별 지침을 찾을 수 없습니다. 내가 한 것은 HTS 웹 사이트에서 샘플 Speaker Dependent Demo를 다운로드하고 해당 데이터를 교육하는 것입니다. 음성 폴더에있는 파일은 cmu_us_arctic_slt.htsvoice
입니다. 그래서 내 두 부분으로 질문 :HTS를 사용하여 Festival의 새로운 음성 빌드하기
1) 나는이 파일을 축제에서 목소리로 어떻게 사용합니까?
2) 내가 가진 강제 정렬 파일에서 내 음성을 훈련하는 데 필요한 파일을 label
및 utt
개 생성하려면 어떻게해야합니까?
도움이 될 것입니다. 감사.