2017-09-16 20 views
0

rpart 패키지를 사용하여 의사 결정 트리를 플롯하려하고 실제로 해당 출력과 혼동합니다. 3 노드에서 농업과 채광 클래스는 도시에서 어떻게 생산 될 수 있는가?rpart를 사용하여 비정상적인 의사 결정 트리 출력 (다중 클래스)을 해석하는 방법

나는 그것이 농업과 광업 대신 도시 농업이어야한다고 생각한다. 여기

df<-read.csv("https://raw.githubusercontent.com/tuyenhavan/Statistics/Dataset/Landsat_Data.csv") 

library(rpart) 

library(rpart.plot) 
set.seed(123) 

dt<-rpart(Land_cover~., data=df) 

rpart.plot(dt,cex=0.35) 

을 설명하기 위해 도와주세요 내 코드입니다. 감사합니다.

답변

0

노드는 모든 응답 범주의 상대적 빈도를 다수 투표와 함께 표시합니다 (즉, 가장 빈번한 범주). 동점이있는 경우, 가장 빈번한 카테고리 중 첫 번째 카테고리가 과반수 투표로 표시됩니다 (이는 다소 임의적 인 선택입니다).

따라서 루트 노드에서 모든 범주는 20 %의 동일한 빈도로 발생하며 사전 식 사전 식이기 때문에 "농업"이 과반수로 표시됩니다.

마찬가지로 노드 3 (Band1> = 0.03599656)에서 "Urban"과 "Water"는 여전히 가장 빈번한 범주로 묶여 있습니다 (200 관측 = 24.969 %). 따라서 "Urban"이 다수 표를 얻습니다.