R에 다음 함수를 작성하여 DATE (YYYY-MM-DD) 열이있는 데이터 프레임의 각 날짜와 전날의 2 일 평균 VAR을 계산했습니다.), ID, VAR1 및 VAR2. 날짜가 없습니다.평균 행과 data.frame의 이전 행
df <- data.frame
TWODAY <- function(df){
df$TWODAY_VAR1 <- NA
for(j in 2:length(df$VAR1)){
df$TWODAY_VAR1[j] <- mean(df$VAR1[j:(j-1)])
}
df$TWODAY_VAR2 <- NA
for(j in 2:length(df$VAR2)){
df$TWODAY_VAR2[j] <- mean(df$VAR2[j:(j-1)])
}
return(df)
}
나는 다음 ddply 내 dataframe에이 기능을 적용 :
df <- ddply(df, "ID", TWODAY)
하지만, 내 dataframe는 13,000,000 이상 관찰로 구성되며,이 매우 느리게 실행됩니다. 누구든지 내 코드를 편집하여 코드를 더 효율적으로 만들 수있는 방법에 대한 권장 사항이 있습니까?
모든 조언을 크게 높이세요! rowMeans
를 사용
나는이 질문에 대한 적당한 장소가 [코드 검토 스택 거래소 (생각 https://codereview.stackexchange.com/). – andrewnagyeb
재현 가능한 예제를 제공해야합니다. https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example – minem