교육 오류 또는 오류 (D)와 테스트 오류 또는 오류를 찾아야합니다. (confidenceInterval (SQRT (에러 (S (1 에러 -/총 인스턴스 후 우리 오차 (S) +를 사용하여 오류 (D)를 찾기 위해 잘못 분류 된 경우 :교육 오류 또는 오류 (D) 및 시험 오류 또는 오류를 찾을 수있는 방법
가설, 우리는 수식을 사용하여 오류 (들)을 찾기 위해 s)/n))))))))
여기서 n = 합계 인스턴스
어떻게 잘못 분류 된 인스턴스를 찾을 수 있습니까? weka에서 평가 클래스의 평가 모델을 사용하여 찾을 수있는 잘못 분류 된 인스턴스와 동일합니까? 나에게 제발 알려
코드 :
import weka.classifiers.evaluation.Evaluation;
import weka.classifiers.trees.J48;
import weka.classifiers.trees.j48.ClassifierTree;
import weka.core.Instances;
import weka.core.converters.ConverterUtils.DataSource;
@SuppressWarnings("unused")
public class J48Tree {
public static void main(String[] args) throws Exception {
//load dataset
DataSource trainsource = new DataSource(".//training data.arff");
DataSource testsource = new DataSource(".//test data.arff");
Instances dataset=trainsource.getDataSet();
Instances datatestset=testsource.getDataSet();
//set class index to the last attribute
dataset.setClassIndex(dataset.numAttributes()-1);
datatestset.setClassIndex(dataset.numAttributes()-1);
//create classifier
J48 tree = new J48();
//using an unpruned J48
tree.setUnpruned(true);
//build the classifier
tree.buildClassifier(dataset);
// evaluate classifier and print some statistics
Evaluation eval = new Evaluation(dataset);
eval.evaluateModel(tree, datatestset);
System.out.println(eval.toSummaryString("\nResults\n======\n", true));
} }
출력 : 당신이 "잘못 분류"와 "잘못 분류"는 의심의 여지가있는 경우
결과
Correctly Classified Instances 540 22.2772 %
Incorrectly Classified Instances 1884 77.7228 %
Kappa statistic 0.0644
K&B Relative Info Score 78375.7967 %
K&B Information Score 1912.8906 bits 0.7891 bits/instance
Class complexity | order 0 7268.6047 bits 2.9986 bits/instance
Class complexity | scheme 725668.4216 bits 299.3682 bits/instance
Complexity improvement (Sf) -718399.8169 bits -296.3696 bits/instance
Mean absolute error 0.2186
Root mean squared error 0.3897
Relative absolute error 91.6895 %
Root relative squared error 109.0212 %
Total Number of Instances 2424