2016-12-15 8 views
0

Weka에서 J48 분류기를 사용하여 예측합니다. 그러나 예측 결과에서 실제 인스턴스 값과 예측 된 인스턴스 값의 인스턴스 순서가 내가 작업중인 데이터 집합의 원래 순서 (즉, 행)와 일치하지 않음을 알았습니다. 무슨 일이 일어날 지 모르는 어떤 생각?Weka : 예상 값

+0

이것은 교차 유효성 테스트 옵션을 선택했기 때문에 나타났습니다. 트레이닝 세트를 사용하더라도 실제 값과 예상 값의 인스턴스 순서에는 영향을 미치지 않습니다. – AppleCinnamon

+0

예제를 제공해주십시오. 결과 행이 데이터 집합과 다른 순서로 있다는 것을 이해했습니다. –

+0

정확하고 교차 조정 옵션의 결과입니다. 내 질문에 대한 답을 찾았으므로 이것이 해결되었습니다. – AppleCinnamon

답변

0

의사 결정 트리를 구성하는 데 사용하는 기능 선택 방법으로 인해 발생한다고 생각합니다. 트리의 루트에서 피쳐가 선택되었을 때, 트레이닝 데이터가 분리 된 엔티티 세트로 분할되고 하나의 서브 세트의 모든 엔티티가 동일한 클래스를 가질 수 있습니다. 그래서이 클래스는 초기 혼란 행렬에 나타납니다.