2016-10-28 8 views
-1

교육 오류 또는 오류 (D)와 테스트 오류 또는 오류를 찾아야합니다. (confidenceInterval (SQRT (에러 (S (1 에러 -/총 인스턴스 후 우리 오차 (S) +를 사용하여 오류 (D)를 찾기 위해 잘못 분류 된 경우 :교육 오류 또는 오류 (D) 및 시험 오류 또는 오류를 찾을 수있는 방법

가설, 우리는 수식을 사용하여 오류 (들)을 찾기 위해 s)/n))))))))
여기서 n = 합계 인스턴스

어떻게 잘못 분류 된 인스턴스를 찾을 수 있습니까? weka에서 평가 클래스의 평가 모델을 사용하여 찾을 수있는 잘못 분류 된 인스턴스와 동일합니까? 나에게 제발 알려

코드 :

import weka.classifiers.evaluation.Evaluation; 
import weka.classifiers.trees.J48; 
import weka.classifiers.trees.j48.ClassifierTree; 
import weka.core.Instances; 
import weka.core.converters.ConverterUtils.DataSource; 
@SuppressWarnings("unused") 
public class J48Tree { 
public static void main(String[] args) throws Exception {  
    //load dataset 
    DataSource trainsource = new DataSource(".//training data.arff"); 
    DataSource testsource = new DataSource(".//test data.arff"); 
    Instances dataset=trainsource.getDataSet(); 
    Instances datatestset=testsource.getDataSet();  
    //set class index to the last attribute 
    dataset.setClassIndex(dataset.numAttributes()-1); 
    datatestset.setClassIndex(dataset.numAttributes()-1);   
    //create classifier 
    J48 tree = new J48(); 
    //using an unpruned J48 
    tree.setUnpruned(true); 
    //build the classifier 
    tree.buildClassifier(dataset);  
    // evaluate classifier and print some statistics 
    Evaluation eval = new Evaluation(dataset); 
    eval.evaluateModel(tree, datatestset); 
    System.out.println(eval.toSummaryString("\nResults\n======\n", true));   
} } 

출력 : 당신이 "잘못 분류"와 "잘못 분류"는 의심의 여지가있는 경우

결과

Correctly Classified Instances   540    22.2772 % 
Incorrectly Classified Instances  1884    77.7228 % 
Kappa statistic       0.0644 
K&B Relative Info Score    78375.7967 % 
K&B Information Score     1912.8906 bits  0.7891  bits/instance 
Class complexity | order 0   7268.6047 bits  2.9986 bits/instance 
Class complexity | scheme   725668.4216 bits 299.3682 bits/instance 
Complexity improvement  (Sf) -718399.8169 bits -296.3696 bits/instance 
Mean absolute error      0.2186 
Root mean squared error     0.3897 
Relative absolute error     91.6895 % 
Root relative squared error   109.0212 % 
Total Number of Instances    2424  

답변

0

후, 동일 소스을 사용하십시오.

웨카의 ssource 코드를 보면 (다행히도 오픈 소스 인은)는 정확히이 무엇을하고 있는지 배울 수있는 방법입니다. 비록 내가 "네 그렇습니다"라고 말할지라도 이것은 하나의 버전에는 맞고 다른 것에는 틀릴 수도 있습니다. 따라서 버전의 소스를 권한있는 리소스로 사용하십시오.