0
질문은 다음과 같이 주어진다 :어떻게 이진 t- 통계를 나타낼까요?
파일 diabetes.csv를 읽는다. BMI와 결과라는 두 가지 변수가 있습니다. 0과 BMI의 표준 편차 모두 성과 동일하다 1 실시 가설하는 비모수 개의 샘플 테스트 데이터 중 일부 데이터 세트에
bmi <- diabetes$BMI
bmi
outcome <- diabetes$Outcome
outcome
n <- length(bmi)
# tstat
tstat <- ???
# Describe the population and draw synthetic samples
f1 <- function()
{
x <- c(bmi, outcome)
x <- sample(x)
m1 <- sd(x[1:n])
m2 <- sd(x[(n+1):length(x)])
return(m1 - m2)
}
# Create sampling distribution
sdist <- replicate(10000, f1())
plot(density(sdist))
# Gap
gap <- abs(mean(sdist) - tstat)
abline(v = mean(sdist) + c(-1,1) * gap, col = "dark orange")
s1 <- sdist[sdist <(mean(sdist - gap)) | sdist >(mean(sdist + gap))]
pvalue <- length(s1)/length(sdist)
pvalue
값 : 변수 결과는 두 값을 취 "당뇨병"이라고합니다. 내 질문은 결과가 바이너리이기 때문에 "t- 통계"를 어떻게 표현할 것인가?