적절한 R 헤더로 EPACTS와 함께 사용하기 위해 내 R-dataset에서 .ped 파일을 쓸 수있는 패키지가 있습니까?r에서 epact로 ped 파일을 작성하는 방법
나는 그것을 구글과 만
적절한 R 헤더로 EPACTS와 함께 사용하기 위해 내 R-dataset에서 .ped 파일을 쓸 수있는 패키지가 있습니까?r에서 epact로 ped 파일을 작성하는 방법
나는 그것을 구글과 만
웹 검색이 작업을 수행 할 도구가 없다는 것을 밝혀 읽을 수있는 방법을 찾을 수 없습니다. 그래서 같은 가용 스루풋 사용 VCF에 PED를 변환 할 수 있습니다
http://genome.sph.umich.edu/wiki/EPACTS#VCF_file_for_Genotypes
:
plink --file prefix --recode vcf --out prefix
추가 바이올린해야 할 수 있습니다 EPACTS는 이것을 받아 들일 것 같이, VCF 형식을 사용하는 것이 좋습니다 옵션은 specfically, 그것은 https://www.cog-genomics.org/plink2/data#recode를 참조하십시오 당신이 원하는 출력을 얻을 수 있습니다 :
The 'vcf', 'vcf-fid', and 'vcf-iid' modifiers result in production of a
VCFv4.2 file. 'vcf-fid' and 'vcf-iid' cause family IDs and within-family IDs
respectively to be used for the sample IDs in the last header row, while
'vcf' merges both IDs and puts an underscore between them (in this case, a
warning will be given if an ID already contains an underscore).
If the 'bgz' modifier is added, the VCF file is block-gzipped. (Gzipping
of other --recode output files is not currently supported.)
The A2 allele is saved as the reference and normally flagged as not
based on a real reference genome ('PR' INFO field value). When it is
important for reference alleles to be correct, you'll usually also want to
include --a2-allele and --real-ref-alleles in your command.
EPACTS 내가 같은 VCF와 PED 파일이 모두 필요 연관 분석을위한 nput. PLINK documentation에 설명 된 PED 파일과 달리 EPACTS에 사용 된 PED 파일에는 유전자형 데이터가 포함되어 있지 않습니다. 그 목적은 표현형 데이터와 공변량을 유지하는 것이며 EPACTS가 인식 할 수 있도록 .ped 확장자가 필요합니다.
R의 데이터 프레임을 PED 파일로 내보내려면 .ped 확장자가 필요하다는 것을 지정하면됩니다. 다음 명령을 사용할 수 있습니다.
write.table(df, filename.ped, sep="\t", row.names=F, col.names=T, quote=F)
EPACTS에서는 열 이름이 포함 된 헤더 행을 주석 처리해야합니다. 나는 보통 '#'을 추가하는 것이 매우 빠르기 때문에이 단계를 수동으로 수행하며 항상 파일을 열어 어쨌든 확인합니다. 또는 col.names = F를 설정하고 EPACTS 설명서에 표시된대로 .dat 파일을 사용할 수 있습니다. https://genome.sph.umich.edu/wiki/EPACTS#PED_file_for_Phenotypes_and_Covariates