2013-10-12 9 views
-1

나는 300 개의 숫자 (1에서 300까지)의 벡터를 가지고 있습니다. 두 가지 하위 집합, 즉 모델/교육 (200 개의 숫자)과 테스트 세트 (100 개의 숫자)를 대체하여 만들고 싶습니다. samplesubset을 사용하려고했지만 원하는 결과를 얻지 못했습니다.랜덤 샘플링이 포함 된 서브셋을 R으로 대체

MWE: 
x=(1,2,3,.......300) 
x1 = (1,1,2,3,5,5,...........,300) (Consider it training set of 200 samples) 
x2 = (1,3,9,101,130,130,..........299) 

의견을 보내주십시오. !!!!!

당신은 다음과 같이 테스트 세트의 모든하지만, 그 인덱스를 선택한 다음 훈련 세트에 대한 임의 인덱스 세트를 생성 할 수
+0

내가 사용하고 있음을 언급하는 것을 잊어 버림 R –

+3

어떻게'sample'을 시도해 보았습니까? – flodel

+0

다음 예는 > x = seq (from = 1, to = 300, by = 1)입니다. > x [1] 1 2 3 4 5 6 7 8 ....... 300 a = sample (x, size = 100, replace = TRUE, prob = NULL) a = sample (x, size = 200, replace = TRUE, prob = NULL) –

답변

0

:

data <- c(1,3,8,7,19,5,4,10,11,20) 
i <- sample(1:length(data), 5) 
training <- data[i] 
test <- data[-i] 

이 훈련 세트 5 점을 얻을 것이다 모든 나머지 포인트는 테스트 세트에 포함됩니다.

+0

고마워, 그게 문제를 해결했다. 그러나, 훈련 세트에 포함되지 않은 지표와 훈련 세트에 포함 된 지표의 조합을 포함하는 시험 세트를 원한다면 (무작위로 다시 채취하여 샘플링). 내가 할 수 있을까? –

+0

물론, 마지막 줄을 test <- sample (data, desiredSampleSize, replace = TRUE)로 바꾸십시오. 여기에서 desiredSampleSize는 테스트 데이터 세트의 크기를 나타냅니다. – StevenHolland