2017-11-25 21 views
0

CHAID가있는 모델을 작성했습니다. 지금은 변수를 예측하는 데 사용할 - 나는 나무() 또는 rpart()와 함께 할 것 같은 :CHAID가 R 예측 인 경우

MA_CHAID <- chaid(Data$target 
       ~ Data$factor1 
       + Data$factor2, 
       control = chaid_control(minprob = 0.001, 
             minsplit = 500,minbucket = 200), 
       data = Data 
       ) 

Data$MA_predict <- predict(MA_CHAID, Data) 

하지만이 오류 메시지가 얻을 :

Error in `$<-.data.frame`(`*tmp*`, MA_predict, value = c(1L, 1L, : 
replacement has 124855 rows, data has 379031 

어떤 생각을?

감사합니다.

답변

0

CHAID 트리가 누락 된 값이있는 예측자를 포함하여 빌드되었습니다.

누락 된 값이있는 모든 행을 알고리즘에서 제외했습니다. 그렇기 때문에 모델의 절반만으로 모델이 구축되었습니다.

내 다음 시도는 "누락"을 카테고리로 사용하는 것입니다.