2017-01-07 12 views
0

유전자의 하위 집합에서 GO 항의 농축을 조사하기 위해 고지 학적 분석 (파이썬 스크립트 사용)을 수행했습니다. 다음과 같이 내 출력의 예는 다음과 같습니다Bongeproni의 고지 학적 분석에서 p- 값의 수정

GO00001 1500 300 200 150 5.39198144708e-77 
GO00002 1500 500 400 350 1.18917839281e-160 
GO00003 1500 400 350 320 9.48402847878e-209 
GO00004 1500 100 100 75 3.82935778527e-82 
GO00005 1500 100 80 80 2.67977253966e-114 

Column1 = GO ID 
Column2 = Total sum of all terms in the original dataset 
Column3 = Total sum of [Column 1] IDs in the original dataset 
Column4 = Sum of all terms in the subset 
Column5 = Sum of [Column 1] IDs in subset 
Column6 = pvalue derived from hypergeometric test 

나는 내가 유의 확률에 의해 실험의 수를 곱해야한다는 것을 알고 있지만 나는 데이터로이 작업을 수행하는 방법을 잘 모르겠어요 나는 가지고있다. 부분 집합 또는 원본 데이터 집합과 하위 집합의 조합을 계산합니까? 예를 들어, 다음과 같습니다이 바보 같은 질문처럼 보이지만 난 그냥 주위에 내 머리를 얻을 수가없는 경우

Column2 * Column5 * pvalue 
Column3 * Column5 * pvalue 
Column4 * Column5 * pvalue 

내가 죄송합니다. 미리 많은 감사드립니다! ? multipletests을 수행 한 얼마나 많은 테스트를 알 수 있을까하는 방법 -

답변

3
from statsmodels.sandbox.stats.multicomp import multipletests 
p_adjusted = multipletests(Column6, method='bonferroni') 

아니면 내가 뭔가를 놓친 거지 .. 당신의 코멘트 문 (phyla)에 대한

+0

감사합니다, 나는 어떻게이 일에 대해 조금 혼란 스러워요? 나는 단지 이해하려고 노력하고 있고 나는 희망없는 초보자입니다! 도와 주셔서 다시 한번 감사드립니다 :) – Gloom

+0

물론 p 값의 수에서. – Phlya