데이터를 세 가지 다른 기간으로 분할해야하지만 각각의 데이터에 대해 (데이터가 누락 됨) 가장 적은 수의 방식으로 데이터를 분할해야합니다. I는 제 PE 정의하면이 경우NAs 수가 가장 적은 기간으로 데이터 분할
library(lattice)
xyplot(Data$Y ~ Data$X,,
panel = function(x, y) {
panel.xyplot(x, y)
panel.abline(v=c(as.Date('2017/05/01'),as.Date('2017/07/01')))
})
3 개 동일 시간대에
Data <- data.frame(
Y = c(rep("A",10),rep("B",10),rep("C",10),rep("D",10),rep("E",10)),
X = c(sample(seq(as.Date('2017/03/01'), as.Date('2017/09/01'), by="day"), 10),sample(seq(as.Date('2017/03/01'), as.Date('2017/09/01'), by="day"), 10),c(as.Date('2017/05/02'),sample(seq(as.Date('2017/05/01'), as.Date('2017/09/01'), by="day"), 9)),sample(seq(as.Date('2017/03/01'), as.Date('2017/09/01'), by="day"), 10),c(as.Date('2017/05/03'),sample(seq(as.Date('2017/05/01'), as.Date('2017/09/01'), by="day"), 9)))
)
분할 그것과 같을 것이다 다음 Y. 여기에 내 데이터 인 riod as 2017/03/01 to 2017/05/03, 2017/04/30 대신에, 나는 첫 번째 기간에 그룹 C와 E에 대해 NA를 가지지 않을 것입니다. 이것이 내가 원하는 것입니다. 2017년 5월 1일에 2017년 6월 30일 :
- 기간 1 :
그래서 나는 그 3 개 기간이 원하는
- 기간 3 : 2017년 7월 1일는
를 2017/09/30하도록하지만 그 기간의 시작/끝과가요까지 10 일이 될 수있다. 시각적으로 보는 것보다 이것을 할 수있는 방법이 있습니까?
당신은'runif 등의 임의의 숫자를 포함하는 샘플 데이터를 작성하는 경우()', 'rnorm()'또는'sample()'은'set.seed ()'를 사용하여 데이터를 재현성있게 만듭니다. 그렇지 않으면 분석 및 예상 결과가 다른 사용자에게 매우 다를 수있는 데이터에 따라 달라집니다. 고맙습니다. –
Uwe