2016-11-02 8 views
1

ENIGMA 프로토콜을 사용하여 투약 된 투약 형태의 SNP의 유전자형을 받았습니다. 나는 plink --dosage [...] --fam [...] 사용하여이 데이터를 분석 할 (I 올바른 구문 믿습니다.)plink로 mach 포맷팅되고 귀속 된 genotyes (ENIGMA)를 처리하는 방법

각각의 염색체를 들어

, 나는 이러한 파일의

% tar -tf chromosome.21.tar 
chunk1-ready4mach.21.imputed.dose.gz 
chunk1-ready4mach.21.imputed.erate.gz 
chunk1-ready4mach.21.imputed.hapDose.gz 
chunk1-ready4mach.21.imputed.haps.gz 
chunk1-ready4mach.21.imputed.info.draft 
chunk1-ready4mach.21.imputed.info.gz 
chunk1-ready4mach.21.imputed.prob.gz 
chunk1-ready4mach.21.imputed.rec.gz 

없음 보이지 않는다 다음과 같은 파일로 구성되는 타르 파일을받은 plink's website에 언급 된 복용량 파일의 규격을 준수해야합니다. (특히 .dose.gz가 아닌 것 같습니다.)

누구나이 경험이 있습니까? 어떤 방식 으로든이 파일들을 수정해야합니까?


% plink --dosage $dose --fam $fam 
PLINK v1.90b3.38 64-bit (7 Jun 2016)  https://www.cog-genomics.org/plink2 
(C) 2005-2016 Shaun Purcell, Christopher Chang GNU General Public License v3 
Logging to plink.log. 
Options in effect: 
    --dosage /home/moebius/tmp/chromosome.21/chunk1-ready4mach.21.imputed.dose.gz 
    --fam hammer.fam 

32054 MB RAM detected; reserving 16027 MB for main workspace. 
842 people (324 males, 518 females) loaded from .fam. 
842 phenotype values loaded from .fam. 
Using 1 thread. 
842 people pass filters and QC. 
Phenotype data is quantitative. 
--dosage: Reading from 
/home/moebius/tmp/chromosome.21/chunk1-ready4mach.21.imputed.dose.gz. 
Error: Column 1 of 
/home/moebius/tmp/chromosome.21/chunk1-ready4mach.21.imputed.dose.gz's header 
isn't 'SNP'. 

답변

1

우리는 가용 스루풋 투약 형식으로 MACH 형식으로되어 수수께끼의 데이터 세트를 변환하는 프로그램 dose2plink을 사용할 수 있습니다.

예 : chunk1.21.pfamchunk1.21.pdat.gz 생성한다

./dose2plink.pl -dose chunk1.21.imputed.dose.gz -info chunk1.21.imputed.info.gz -out chunk1.21 

.