데이터에 kmeans 알고리즘을 사용하려고합니다. 실행 중에 전달해야하는 옵션에는 초기 클러스터에 대한 경로가 필요합니다. 알고리즘을 시작하기 전에 어떻게 초기 클러스터를 가질 수 있습니까?mahout를 사용하는 Kmeans 클러스터링
bin/mahout kmeans \
-i <input vectors directory> \
-c <input clusters directory> \
-o <output working directory> \
-k <optional number of initial clusters to sample from input vectors> \
-dm <DistanceMeasure> \
-x <maximum number of iterations> \
-cd <optional convergence delta. Default is 0.5> \
-ow <overwrite output directory if present>
-cl <run input vector clustering after computing Canopies>
-xm <execution method: sequential or mapreduce>
[여기] (http://unmeshasreeveni.blogspot.in/2014/11/how-to-run-k-means-clustering-in-mahout.html)는 syntheticcontrol 데이터를 실행하는 예제입니다. –