2012-10-29 18 views

답변

1

Kaldi 또는 Sphinx과 같은 오픈 소스 음성 인식 도구 키트의 프론트 엔드를 사용할 수 있습니다.

2

2016에서의 요점을 되풀이하다 :

  • libmfcc는 간단하다, MIT 라이센스, 지원되지 않는 2010 년
  • YAAFE 2011 년
  • Kaldi부터 지원되지 않는의 MFCC 및 기타 기능, LGPLv3을 제공하기 때문에이 과잉이다하지만, 그것은 단지 MFCC를 위해 사용될 수 있습니다. Apache License v2.0이며 여전히 지원됩니다.
  • PocketSphinx은 음성 인식, CMU 라이센스 (BSD 스타일)를위한 CMU 툴킷이며 여전히 지원됩니다.
  • SPTK은 일본의 Research Toolkit이며 수정 된 BSD 라이센스이며 여전히 지원됩니다.
  • OpenSMILE에는 (1) 연구 및 개인용으로 사용할 수있는 유연한 라이센스와 (2) 상업용 라이센스가 있습니다.

참고 Sphinx 대신 PocketSphinx가 언급되어 있습니다. 후자는 Java로 작성되어 있기 때문입니다.