mydata
에서 2673 개의 관측치와 23 개의 변수가있는 교육 및 테스트 데이터를 만들고 싶습니다. 그러나 훈련 데이터를 단순히 빼는 것만으로 테스트 세트를 만들 수는 없습니다. 나는 다음을 실행하면 훈련 및 테스트 데이터 세트 만들기 R
dim(mydata)
## [1] 2673 23
set.seed(1)
train = mydata[sample(1:nrow(mydata), 1000, replace=FALSE), ]
dim(train)
## [1] 1000 23
, 나는 19 경고를 얻었고, 그 결과는 20,062 관측이 : 내가 잘못 뭐하는 거지
test = mydata[!train, ]
## There were 19 warnings (use warnings() to see them)
dim(test)
## [1] 20062 23
를?
관련 항목 http://stackoverflow.com/q/5963269/54964 –