0
저는 PimaIndianDiabetes를 사용하여이 R 최소 작업 환경을 갖추고 있습니다.여러 개의 확률로 "PimaIndiansDiabetes"에 대해 IFELSE를 사용하여 교육/테스트 세트로 데이터를 분할하는 방법은 무엇입니까?
#load required library
library(mlbench)
#load Pima Indian Diabetes dataset
data(PimaIndiansDiabetes)
#set seed to ensure reproducible results
set.seed(42)
#split into training and test sets
PimaIndiansDiabetes[,train] <- ifelse(runif(nrow(PimaIndiansDiabetes))
<0.8,1,0)
#separate training and test sets
trainset <- PimaIndiansDiabetes[PimaIndiansDiabetes$train==1,]
testset <- PimaIndiansDiabetes[PimaIndiansDiabetes$train==0,]
#get column index of train flag
trainColNum <- grep(“train”,names(trainset))
#remove train flag column from train and test sets
trainset <- trainset[,-trainColNum]
testset <- testset[,-trainColNum]
#get column index of predicted variable in dataset
typeColNum <- grep(“diabetes”,names(PimaIndiansDiabetes))
당면한 문제는 R 코드에 지정된 확률로 IFELSE 기능을 사용하여 교육 및 테스트 세트로 데이터를 분리하는 것입니다.
PimaIndiansDiabetes[,train] <- ifelse(runif(nrow(PimaIndiansDiabetes))
<0.8,1,0)
ifelse에서 실수가 있었다
에 대한
같은 열을 제거하기 위해 dplyr 패키지를 사용 ] <- ifelse (runif (nove (PimaIndiansDiabetes)) <0.8,1,0) – economia
내 대답을 편집합니다. 변수 열을 사용하여 새 열을 지정하려고하면 오류가 발생하지만 'train'문자열은 – Linus