2012-11-06 5 views
-1

Java로 데이터 그룹을 클러스터링하는 코드를 작성했습니다. Apache Mahout을 사용하여 클러스터를 구축하고 있습니다. 여기에 내 코드의 조각 :거리 Java Mahout 라이브러리에있는 데이터의 거리 유형

 Configuration conf = new Configuration(); 
     Path input = new Path("C:\\DATA\\input.txt"); 
     Path clusters = new Path("C:\\DATA\\clusters.txt"); 
     Path output = new Path("C:\\DATA\\output.txt"); 
     org.apache.mahout.common.distance.DistanceMeasure measure; 
     String delta = new InterruptedException().toString(); 
     org.apache.mahout.clustering.kmeans.KMeansDriver myK = new KMeansDriver(); 
     myK.buildClusters(conf, input, clusters, output, measure, 100, delta, true); 

는하지만 "측정"매개 변수를 작성 중에 오류가 발생 : "변수 측정이 초기화되지 않았을 수도 있습니다." https://builds.apache.org/job/Mahout-Quality/javadoc/org/apache/mahout/clustering/kmeans/KMeansDriver.html 그래서

, 어떻게 내가 "측정"의 진정한 가치를 정의 할 수 있습니다 : 여기

는 기능 buildClusters의 문서인가?

답변

1

DistanceMeasure (link)는 인터페이스입니다. 당신은 예를 CosineDistanceMeasure 또는 그런데 EuclideanDistanceMeasure

, 나는 왜 델타는 다음과 같이 정의된다 궁금해 인터페이스의 구현 중 하나를 사용해야합니다 String delta = new InterruptedException().toString();

delta이 수렴 델타 값으로 정의된다 내부적으로는 double로 구문 분석됩니다.