2016-09-19 14 views
1

새 데이터가 주어지면 scikit-learn의 DP-GMM이 클러스터 할당의 온라인 업데이트를 허용하지만 sklearn의 구현 인 DP-GMM에는 맞는 방법 만있을 것으로 예상됩니다.DP-GMM 및 온라인 클러스터 할당

변이 형 추론에 대한 나의 이해는 아직 명확하지 않고 클러스터 할당의 온라인 업데이트가 불가능하다는 점은 sklearn의 구현에 중요하지만 무한 GMM에 대한 변이 추정이 아니라고 생각합니다.

누군가가 이것을 명확히하고 클러스터 할당을 온라인으로 업데이트 할 수있는 구현을 지적하면 매우 감사 할 것입니다.

http://scikit-learn.org/stable/modules/generated/sklearn.mixture.DPGMM.html

답변

0

Dawen Liang의 설명 게시 :

  1. 베이지안 비모수가 동일하지 않은 온라인 학습을 수행합니다. 단지 데이터를 기반으로 모델의 복잡성을 결정하는 것을 의미합니다. 이는 일괄 학습 환경에서 발생할 수 있습니다 (sklearn의 DP-GMM 구현). 당신은 확실히 당신에게 온라인 학습을 할 수있는 기능을 제공 무엇을 확률 적 최적화 방법을 적용 할 수 있도록

  2. 변분 추론은, 본질적으로 최적화 기반의 방법이다. 베이지안 비모수 모델에 대한 확률 적 추론을 적용하는 것은 실제로 여전히 활발한 연구 분야입니다.

Emily Fox's sampler sticky HDP-HMM

John Paisley's group HDP-HMM Matt Hoffman's infinite HMM (perhaps not HDP)

1http://www.stat.washington.edu/~ebfox/software/HDPHMM_HDPSLDS_toolbox.zip