2009-11-18 6 views
2

"감독되지 않은 분류"가 포함 된 연구를하고 있습니다. 기본적으로 나는 trainSet을 가지고 있으며, 나는 무작위 방식으로 X 개의 클래스로 데이터를 클러스터하고 싶다. 아이디어는 k-means가하는 것과 유사합니다. 감독되지 않은 분류 방법이 있습니다.

는 이제

1 단계) 된 형상은 [1057x10] matrice라고하자 나는 88 개 클러스터로 클러스터 싶다.

2 단계) 를 사용하여 이전에 TestData 사용이

질문 을 분류 않는 방법을 계산하는 클래스를 계산가 결정됨이 가능 SVM 또는 N-N와 함께 할 방법? 다른 건 없니? - 다른 권장 사항은 무엇입니까?

+0

실제로 k- 수단을 사용해 보셨습니까? 그것은 문제에 잘 맞는 것 같습니다. – Stompchicken

+0

안녕하십니까. 실제로 그것을 확인하십시오. 그러나 결과를 비교하기 위해 다른 방법으로 동일한 작업을 수행해야합니다. 추천 사항이 있으십니까? – tguclu

+0

SVM은 감독되지 않고 감독되므로 원하는 것을 확인하지 못합니다. – Davide

답변

2

거기에는 많은 클러스터링 알고리즘이 있으며 웹에는 이에 대한 정보와 샘플 구현 정보가 가득합니다. 좋은 출발점은 클러스터 분석 Cluster_analysis에 대한 Wikipedia 항목입니다.

효과적인 k-means 구현을 사용하면 더 많은 결과를 얻을 수 있는지 많은 변형 중 하나를 시도 할 수 있습니다 (k-means ++ 아마도 SVM을 언급 한 것처럼 보임). 완전히 다른 접근 방식을 원하면 Kohonen Maps (자체 구성 기능지도라고도 함)를 살펴보십시오. 너무 까다로운 경우 간단한 계층 적 클러스터링을 구현하기 쉽습니다 (가장 가까운 두 항목 찾기, 결합, 헹굼 및 반복).

1

이것은 고전적인 클러스터링 문제와 같습니다. SVM이나 신경 네트워크 어느 것도이 문제를 직접 해결할 수 없습니다. 예를 들어, dimensionality reduction에 대해 두 가지 방법 중 하나를 사용하여 10 차원 데이터를 2 차원 공간에 포함 할 수 있지만 데이터를 클러스터에 넣지는 않습니다.

k-means 외에 많은 수의 클러스터링 알고리즘이 있습니다. 대조적 인 방법을 원하면 agglomerative clustering 알고리즘을 사용해보십시오. 어떤 종류의 컴퓨팅 환경을 사용하고 있는지 알지 못하지만, 나는 Rthis (very) short guide on clustering을 매우 좋아합니다.