R에서 GLM을 사용하여 데이터 집합에 대한 통계 분석을 수행합니다. 기본적으로 예측 변수는 다음과 같습니다. "프로브"(실험에 사용 된 프로브 유형 - 4 단계), "추출"(실험에 사용 된 추출 유형 - 2 단계 요소), "탱크"(시료를 수집하는 탱크 번호 - 1에서 9까지의 정수) 및 "희석" 샘플 - 숫자 : 3.125, 6.25, 12.5, 25,
일부 값이 NA 인 요소 열이있는 data.table이 있습니다. NAs가 내 모델에 대해 의미가 있으므로 요인의 수준 (예 : 이 아닌 x <- factor(x, exclude=NULL))으로 의도적으로 NA를 포함 시켰습니다. 이 요소 열의 경우 NA에 대한 참조 수준을 relevel()으로 지정하려고하지만 구문에 어려움을 겪고 있습니다. # silly
저는 R에 익숙하지 않으며 의사 방문에 대한 데이터에 대한 포아송 회귀 분석을 사용한 후에 예측을하기 위해 변수 '성별'을 일정한 평균으로 유지하는 방법을 알아야합니다. 지주 동안 (남성과 여성을위한 2 주 기간에 걸쳐 의사 방문의 비율을 예측하는 방법 (아래 참조) visits gender illness age.category
1 female
안녕하세요 저는 문제가 발생한 날부터 문제에 대해 고심하고 있으며 아직 답변을 찾지 못했습니다. 저는 국가, 인구로 된 열이있는 데이터 세트가 있다고 가정합니다. 나는 국가는 다음과 같은 수준의 요인이되고 싶어 df <- data.frame(country=c(1,2,3,4,5,6), population=c(10000,20000,30000,4000,50000
Windows 10에서 R 3.3.1 사용. 나는 95 행의 데이터에서 x-y 플롯을 만들고 있습니다. 데이터는 6 개의 다른 그룹 ("그룹"이라는 요소)에 있습니다. 플롯 자체만으로는 충분하지만, 요소와 색상을 올바르게 설명하는 범례를 얻을 수 없습니다. 여기에 변수 V1의 데이터를 다음과 같습니다 v1 <- structure(list(group = st
사용자가 shiny app을 작성하여 사용자가 여러 변수가 포함 된 .csv 파일을 업로드합니다. dplyr을 사용하면 아래에 표시된 첫 번째 네 개의 변수 인 select을 가져와 긴 형식으로 변환합니다. 데이터 df <- read.table(text = c("
Customer Rate Factor Power
W1 6 TK1 5
W2 3 TK1 0
다른 것들 중에서 - 같은 것을 참조하는 두 개의 열이 포함 된 데이터 프레임이 있습니다. 하나는 다른 ID에 대한 숫자 ID로, 요인으로 분석됩니다. df = data.frame(
"id" = c(5, 3, 1, 2, 4, 5),
"val" = factor(c("a", "b", "c", "d", "e", "a")),
"someCo
요인을 사용하고 싶지만 몇 가지 문제가 있습니다. 0,stack
0,exchange
0,overflow
1,list
1,stack
첫 번째 : 내 질문은 완전히 : 이 (실제 데이터가 있지만, 유사한 형태의 훨씬 더 큰 것입니다) 예를 들어 다음과 같은 데이터 "my_data를"고려 나는 요인을 이해하지 않았다는 것을 공개 할 수 열이 이며 us