나는 posible 버그를 테스트하고 싶은 POS 태깅을위한 감독되지 않은 HMM 트레이너를 개발하는 프로젝트를 진행 중이다. 저는 Baum-Welch 알고리즘을 사용하여 모델을 교육하고 있습니다. 입력은 시퀀스 워드 (코퍼스에서 가져옴)이며 출력은 상태 집합 (s1, s2, ... sn)의 숨겨진 상태 시퀀스입니다. 이제 코드 작성이 완료되었지만 버그가
클러스터링 (감독되지 않은 학습)을 사용하여 형성된 클러스터를 평가하는 것에 대해 여전히 연구 중입니까? 나는 인터넷 검색을 시도했지만 내가 취하는 조치는 너무 이론적이다. 형성된 클러스터를 평가하는 데 사용하는 메커니즘을 사람들이 공유 할 수 있다면 좋을 것입니다. Java EE, Java ME, RMI, JVM 등을 포함하는 Java 클러스터가 있다고
상용 제품을 분류해야합니다. 가격 비교 엔진이하는 일을 알고 있습니다. 우리는 특징 벡터를 얻었다. 그들은 최고지만 아직 좋지 않습니다. 마지막 단계는 클러스터의 수를 모른 채 분류하는 것입니다. 따라서 k-means와 같은 알고리즘은 클래스가 몇 개인 지 요구되기 때문에 작동하지 않습니다. 여기 예제 벡터 집합입니다. 그들은 여기에 순서대로 (예)하지만