2014-01-10 4 views
2

LIUM_SpkDiarization-4.7.jar라는 라이브러리를 사용하고 있지만 어떻게 작동하는지 잘 모르겠습니다. 누구든지 조금 설명해 주시겠습니까?LIUM Speaker Diaritization은 어떻게 작동합니까? 내 프로젝트에

또한 파이썬과 함께 사용하고 있습니다.

라이브러리에 대한 링크는 다음과 같습니다 사전에 https://voiceid.googlecode.com/svn-history/r11/trunk/scripts/LIUM_SpkDiarization-4.7.jar

감사합니다.

답변

2

나는이 도구를 몰랐습니다. 정말 멋지다. 당신은 위키를 확인 했습니까? 시스템 작동 방식에 대한 몇 가지 문서가 있습니다. http://lium3.univ-lemans.fr/diarization/doku.php

기본적으로 MFCC Mel 주파수 셉 스트 럼 계수 (표준 기술)를 계산합니다. 이것은 기본 단계입니다. 작업 할 기능 공간을 생성합니다. 그것은 슬라이딩 윈도우를 통해 FFT를 계산하는 것과 유사합니다. 궁극적으로 BIC (Bayesian Information Criterion) 방법을 사용하여 이러한 시간 분리 된 피쳐에서 클러스터링이 수행됩니다. 먼저 시간 기반 기능 공간을 분할 한 다음 클러스터에 추가하고 각 스피커에 일관된 기능을 찾습니다. HMM, viterbi, EM, 때로는 GMM도 사용할 수 있습니다.

나는 상세하게 설명 할 충분히 알고리즘을 모르겠지만, 이것은 또한 도움이 될 것입니다 http://lium3.univ-lemans.fr/diarization/doku.php/overview

+0

감사합니다. 나는 위키를 보았고 유망 해 보인다. 나는 그것을 들여다 볼 것이다. – dmacan23