저는 응답자에게 일련의 질문이 주어졌으며 각 질문에는 다섯 가지 응답 옵션 (예 : 1 : 5)이 있습니다. 이 다섯 가지 옵션을 감안할 때, 각 질문에 대한 점수 키가 있습니다. 일부 응답은 전체 점 (예 : 2), 다른 하나는 절반 점 (1), 다른 점은 0 점입니다. 따라서 데이터 프레임은 n (사람) x k (질문)이고 채점 키는 k (질문) x m
각 ICPSR에 대한 주제 비율을 찾으려고합니다. 데이터는 다음과 같습니다. ICPSR date day month year mention topic
169538 15444 2009-06-02 2 June 2009 1 18
169544 15444 2010-03-02 2 March 2010 1 20
169581 1544
여러 질문 (y1, y2, y3, ...)에 대한 정수 값 응답 및 각 응답자에게 할당 된 가중치 수 (weighted count)로 구성된 측량 데이터로 작업 중입니다. foo <- data.frame(wcount = c(10, 1, 2, 3), # weighted counts
y1 = sample(1:5, 4, replace=T), #
plyr의 join_all() 함수를 사용하고 싶지만 '오류 : 함수를 찾을 수 없습니다'라는 join_all을 계속 사용하십시오. plyr에 "library (plyr)"또는 "require (plyr)"를로드했으며 패키지의 다른 기능을 문제없이 사용할 수 있습니다. 어떤 문제가 어떤 문제 일 수 있습니까? 고마워, MCE 몇 가지 테스트 코드 아래 :
재현 가능한 예제로 내 질문을 게시하고 있습니다. 문제 : 샤이닝을 사용할 때 다른 요인 (담배 사용, 성별 등)에 따른 평균 수축기 혈압을보고 할 수 없습니다. RStudio에서 적절한 출력을 생성 할 수는 있지만 Shiny를 사용할 때는 요소 레벨별로 특정 값을보고하는 기능을 사용할 수 없습니다. R에서 작동하는 코드의 예 : a<- runif(99,
일부 데이터를 요약하려고합니다. family status sum
1 EMS Off 77
2 EMS On 568
3 MWO Off 1704
4 MWO On 2600
을이 같이 다양한 형식으로 변환하는 dcast 사용에서 : 내가 알아낼 수 없습니다 무엇 family Off On
1 EMS 77 568
2 MWO 1704 2600
이
고유 한 값을 기반으로 데이터 프레임의 열에서 평균값을 얻으려고합니다. 그래서이 칼럼에서 칼럼 b와 칼럼 c의 의미를 얻으려고 시도하는 것은 칼럼 a의 고유 한 값을 기반으로합니다. 나는 (a)가 a의 고유 한 값으로 계산할 것이라고 생각했지만 (a의 고유 한 값을 제공함) 전체 b 또는 c 열의 평균을 나타냅니다. df2<-data.frame(a=seq(
제 연구에서 저는 대용량 4D 배열 (20-200 만개의 요소)을 처리합니다. 속도와 단순성 간의 최적의 균형을 찾는 계산 속도를 개선하려고합니다. 나는 이미 SO 덕분에 한발 더 나아 갔다. (here과 here) 이제 data.table과 plyr과 같은 최신 패키지를 이용하려고한다. 은의이 같은 시작하자 : D = c(100, 1000, 8) #x,y
약 20 개의 변수가있는 데이터 집합이 있습니다. 데이터는 3 년 (2012-2014)에 수집되었으며 매년 각 관찰은 Site 및 Plot으로 그룹화 할 수 있습니다. 년 사이의 각 관찰에 대한 차이 (즉, 가치의 변화)를 찾고 싶습니다. 2012 년 데이터 수집을 시작한 이래로 2013 년과 2012 년, 2014 년과 2013 년 (2014 년 -201
도시의 무리가있는 파일 (지금까지 183 개)이 있는데 그 중 어떤 것도 카운티가 매핑되어 있지 않아 필요한 항목입니다. 범주 형 변수를 다시 코딩 할 때는 보통 plyr의 rename() 함수를 사용하지만이 모든 도시를 코드화하는 지저분한 불쾌한 코드를 작성하고 싶지는 않습니다. 나는 최근에 파이썬을 조금 배웠고,이 문제는 사전/해쉬 테이블 문제와 비슷하