htk

0열

1답변

어휘 파일을 지정하지 않고 HTK의 HVite를 사용할 수 있습니까? 순수한 전화 인식을하고 음성 WAV에 해당하는 전화 수준의 실습 파일 만 있습니다. vocab 파일을 정의하지 않았습니다 ...

0열

1답변

나는 HTK를 사용하여 음향 모델을 훈련합니다. 나의 마지막 단계는 전화 가우시안들의 혼합물을 나누는 것이다. 일반적으로 항상 모든 전화기 (내부 상태)를 한 단계 씩 분리 한 다음 성능이 떨어지면 다시 계산하고 중지합니다. 이제는 전화기를 하나씩 나누어 시험해보고 싶습니다. 전반적인 결과가 같거나 더 우수해야하기 때문입니다. 내가하는 방식은 모든 전화를

2열

2답변

커스텀 언어 용 TTS (Text-to-speech) 시스템을 설계하는 툴킷?

본국 미국 언어 (도우 끼이) 용 TTS 시스템을 만들고 싶습니다. 언어는 라틴어 (서양) 알파벳으로 작성됩니다. 나는 음성학 (각 단어를 IPA 기호로 변환하는 규칙)에 관한 정보도 가지고있다. 출생지 사람들로부터 음성 녹음 데이터베이스를 만들 계획입니다. 그런 다음 IPA 동등성 정보를 사용하여보다 정확한 음성 모델을 생성하여 데이터를 어떻게 든 훈련시

0열

1답변

How to do HTK를 사용하여 언어 모델링

언어 모델링을 위해 HTK를 사용하는 방법에 혼란 스럽습니다. 나는 훈련 후 http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial Voxforge 사이트에서 튜토리얼 예제를 따라 테스트 나는 약 78 %의 정확도를 얻었다. 내 모국어로이 작업을 수행했습니다. 이제 언어

1열

1답변

HTK 공구 및 샘플링 속도

안녕하세요. (이 문장을 시작하는 것이 좋습니까?) 음성 (단어) 인식이있는 HTK 도구로 시뮬레이션하려고했습니다. 그리고 * .wav 파일이 있습니다. 일부 파일의 경우 16KHz 샘플링 속도가 있고 일부 파일의 경우 44.1KHz 샘플링 속도가 있습니다. 그리고 각 샘플링 속도에 대해 mfcc 파일을 만듭니다. 그러나 모든 (16KHz 및 44.1KHz

1열

1답변

HTK - HMM 모델 및 입력 WAV 파일의 MFCC는 무엇을 나타 냅니까?

HTK (Hidden Markov Model Tool Kit)를 사용하여 Speech to Text 시스템에 대해 Voxforge's tutorial 다음에 MFCC를 생성하는 동안 우리는 전화기에 대한 프로토 타입 모델을 정의해야합니다. 나는이 파일 주위에 머리를 감싸려고 노력하고있다. ~o <VecSize> 25 <MFCC_0_D_N_Z> ~h "pr

2열

1답변

사전없이 비언어적 인 음성 인식을위한 오픈 소스 도구

그냥 일반적인 연구를하고 있습니다. 다음을 수행하는 오픈 소스 (또는 유료) 도구/프로그램이 있습니까? INPUT : 레이블이 지정되지 않은 일부 오디오 파일, 어쩌면 몇 문장 길이의 음성 파일 (음성 표기가 무엇인지 표시되지 않음) 오디오) 출력 : IPA의 alphebet에서 음성 녹음 방송과 오디오 파일() 정렬 및 오디오 에 표시된 그냥 음성 사전으

0열

1답변

HTK 오류 : 요청한 데이터 형식이 지원되지 않습니다.

HTK 테이크 업을 설치했습니다. win10 시스템에서 "hslab yes.sig"명령 줄을 종료했을 때 발생했습니다. 다음 오류 : 오류 [6006] StartAudi : 요청 된 데이터 형식은 지원되지 않습니다 [ERR = 2] FATAL ERROR - 종료 프로그램 HSLAB 조언을 줄 수 있습니까? 정말 고마워!

1열

1답변

초기화 중 ... 'sox'명령이 0이 아닌 종료 상태 2를 반환했습니다.

비슷한 오류 메시지를 확인했지만 내 상황에 맞는 것을 찾지 못했습니다. HTK, Prosodylab-aligner 및 SoX를 사용하여 .wab 파일을 .lab 파일과 시간을 맞추려고합니다. ./align.py /path/to/files 모든 그 등장이 코드 라인 : Command 'sox' returned non-zero exit status 2

0열

2답변

HTS를 사용하여 Festival의 새로운 음성 빌드하기

저는 HMM 기반 접근 방식을 사용하여 현지 언어 용 신시사이저를 만드는 프로젝트를 진행하고 있습니다. 지금까지 HTK Book에서 설명한대로 정렬 된 정렬 파일 (aligned.mlf)을 생성 할 수있었습니다. 그러나 HTS를 사용하여 신시사이저를 만드는 방법에 대한 단계별 지침을 찾을 수 없습니다. 내가 한 것은 HTS 웹 사이트에서 샘플 Speaker