현재 R의 문제를 해결하고 있습니다. 데이터 세트에 분류 트리를 적용하고 싶지만 이미 Weka를 사용하여 동일한 문제를 해결 했으므로 결과가 잘못되었습니다. 나는 다른 결과를 얻었다. 의사 결정 트리 분석 문제
나는 다음과 같은 csv 파일에 포함 된 데이터 세트를 가지고 :age,menopause,tumor.size,inv.nodes,node.caps,deg.malig,breast,breast.quad,irradiat,class
40-49,premeno,15-19,0-2,yes,3,right,left_up,no,recurrence-events
50-59,ge40,15-19,0-2,no,1,right,central,no,no-recurrence-events
50-59,ge40,35-39,0-2,no,2,left,left_low,no,recurrence-events
40-49,premeno,35-39,0-2,yes,3,right,left_low,yes,no-recurrence-events
40-49,premeno,30-34,3-5,yes,2,left,right_up,no,recurrence-events
을 그리고 이것은 스크립트입니다 : 당신이 R 내 코드에서 여기 무작위 표본을 선택한
#Open r file
cancer = read.csv("cancer.csv")
#Data Exploration
summary(cancer)
str(cancer)
#Divide into test and train sets
set.seed(1234)
ind <- sample(2, nrow(cancer), replace=TRUE, prob=c(0.7, 0.3))
trainData <- cancer[ind==1,]
testData <- cancer[ind==2,]
#Build the model
library(party)
cancermodel <- class ~ age + menopause + tumor.size + inv.nodes + node.caps + deg.malig + breast + breast.quad + irradiat
cancertree <- ctree(cancermodel,trainData)
table(predict(cancertree),trainData$class)
#Draw tree
plot(cancertree, type="simple")
#Testset
testPred <- predict(cancertree, newdata = testData)
table(testPred, testData$class)
왜이 동일해야? – rawr
두 알고리즘 (결정 트리) – Zak
에 적용한 것과 동일한 알고리즘과 임의로 샘플링 한 교육 및 테스트 데이터가 동일해야하기 때문에? – rawr