2013-05-08 2 views
0

난 ANOVA 및 TukeyHSD를 1 열 (region)의 해부학 적 영역과 2 열 (S1)의 유전자 발현 값을 포함하는 데이터 프레임에서 실행했습니다. 나는 일반적으로 aov 요약의 p 값이 Pr (> F)으로 표시 될 것으로 예상하므로 얻은 결과는 약간 퍼지기 마련입니다. 또한 누군가가 평균 결과의 Tukey 다중 비교를 이해하도록 도와 줄 수 있습니까? 나는 diffp adj 결과가 나타내는 것을 완전히 명확하지 않습니다. 여기에 표시된 결과는 내가 실제로 작업하고있는 것의 요약 된 버전입니다 (참고로 FYI).R : ANOVA 및 TukeyHSD 분석 결과 해석

set.seed(1) 
df1 <- data.frame(
    f1=as.factor(rep(seq(1:3),4)), 
    c1=abs(rnorm(12))) 
s1 <- stats::aov(df1$c1 ~ df1$f1) 
summary(s1) 

이 당신과 같은 출력을 제공한다 :

> aov.result = aov(S1 ~ region, data=raw.data) 
> summary(aov.result) 
      Df Sum Sq Mean Sq F value Pr(>F)  
region  60 61.713 1.02856 5.9246 < 2.2e-16 *** 
Residuals 655 113.712 0.17361      
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
> TukeyHSD(aov.result) 
Tukey multiple comparisons of means 
    95% family-wise confidence level 

Fit: aov(formula = S1 ~ region, data = raw.data) 

$region 
        diff   lwr   upr  p adj 
AB-AA  0.4118651583 -2.864195e-01 1.110149848 0.9847745 
AHA-AA  -0.0468785098 -7.608569e-01 0.667099930 1.0000000 
APir-AA  0.4419135565 -2.563711e-01 1.140198246 0.9502924 
B-AA   0.5379787168 -1.603060e-01 1.236263406 0.5846356 
+1

'summary.aov' 결과물이 여러분의 기대에 부합하기 때문에 질문의 첫 부분을 이해하지 못합니다. 'diff'는 단순히 두 그룹 평균의 차이입니다. 'p adj '는 Tukey로 조정 된 p 값, 즉 diff에 대한 유의성 테스트의 결과입니다 (다중 테스트 고려). 귀하의 질문은 주제와 관련이 없습니다. – Roland

답변

2

일부 재현 데이터, 하나 개의 요소와 하나 개의 연속 가변으로 시작하자.

데이터에 대한 P 값이 올바른지 나타나고 예와 함께 확인할 수 있습니다

:

s2 <- stats::TukeyHSD.aov(s1) 

$`df1$f1` 
      diff  lwr  upr  p adj 
2-1 -0.06282377 -1.038236 0.9125887 0.9823655 
3-1 -0.09820762 -1.073620 0.8772048 0.9575774 
3-2 -0.03538385 -1.010796 0.9400286 0.9943641 

:의 출력을보고, 지금

1-stats::pf(q=5.92, df1=60, df2=655) 
[1] 0 

첫 번째 열은 평균의 차이입니다. 제 예제 :

m1 <- mean(df1$c1[df1$f1==1]) 
m2 <- mean(df1$c1[df1$f1==2]) 

지금 m2-m1 여기 -0.068..

이 '수단의 차이's2$"df1$f1"[1,1] 대략 동일하다 studentized range (q) distribution에서 산출 된 신뢰 구간을 갖는다. 메카닉은 소스 코드 stats::TukeyHSD.aov()에서 찾을 수 있습니다. ?ptukey도 참조하십시오. 또한 특정 상황에서 '다중 비교를위한 수정'의 이론적 근거는 controversial입니다. 이런 종류의 질문은 CrossValidated에 더 적합 할 수 있습니다.