여러 질문 (y1, y2, y3, ...)에 대한 정수 값 응답 및 각 응답자에게 할당 된 가중치 수 (weighted count)로 구성된 측량 데이터로 작업 중입니다.플라이어 가중치 테이블 데이터 프레임
foo <- data.frame(wcount = c(10, 1, 2, 3), # weighted counts
y1 = sample(1:5, 4, replace=T), # numeric responses
y2 = sample(1:5, 4, replace=T), #
y3 = sample(1:5, 4, replace=T)) #
>foo
wcount y1 y2 y3
1 10 5 5 5
2 1 1 4 4
3 2 1 2 5
4 3 2 5 3
그리고이 값을 가중치 테이블의 통합 된 데이터 프레임 버전, 즉 응답 값을 나타내는 첫 번째 열과 가중치 수를 나타내는 다음 세 개의 열로 변환하고 싶습니다.
library(Hmisc)
ty1 <- wtd.table(foo$y1, foo$wcount)
ty2 <- wtd.table(foo$y2, foo$wcount)
ty3 <- wtd.table(foo$y3, foo$wcount)
bar <- merge(ty1, ty2, all=T, by="x")
bar <- merge(bar, ty3, all=T, by="x")
names(bar) <- c("x", "ty1", "ty2", "ty3")
bar[is.na(bar)]<-0
>bar
x ty1 ty2 ty3
1 1 3 0 0
2 2 3 2 0
3 3 0 0 3
4 4 0 1 1
5 5 10 13 12
내가 ddply plyr 및 numcolwise 또는 이것을 자동화하는 방법이 의심이 사용하여 열을 기준으로 명시 적으로 수행 할 수 있습니다. 예를 들어, 다음은 거의 끝나지만 작업을 완료하는 데 필요한 다른 것이 있는지 잘 모르겠습니다.
library(plyr)
bar2 <- numcolwise(wtd.table)(foo[c("y1","y2","y3")], foo$wcount)
>bar2
y1 y2 y3
1 1, 2, 5 2, 4, 5 3, 4, 5
2 3, 3, 10 2, 1, 13 3, 1, 12
의견이 있으십니까?
안녕하세요, 무엇을 조사 작업중인 : 많은, 많은 예제하지만 RECS에 대한 http://asdfree.com/를 참조 같은 것을 할? 이것은'confidence' 간격을 맞추기 위해'mitools' +'survey' 패키지가 필요한 다중 대체물처럼 보입니다. –
저는 EIA의 미국 가정용 에너지 소비 조사 (RECS)와 협력하고 있습니다. 참조 정보를 주셔서 감사합니다. 모든 것에 대한 패키지가 있습니다. – Bryan
이것은 복제 기반 조사 일뿐입니다. 당신은 바퀴를 다시 발명하려고합니다. 당신은 훨씬 더 쉽게 시간을 가질 것입니다. (공식적인 방법을 복제하십시오.) (http://www.eia.gov/consumption/residential/methodology/2009/pdf/using-microdata- 022613.pdf). :) –