간단한 예제와 함께이 스크립트 (vcf-consensus)를 사용하려고하는데 하나의 오류가 있습니다. 시퀀스 "7"이 fasta 파일에서 발견되지 않습니다.Error vcf-consensus script
syntaxis은 다음과 같습니다
TGGCTGGAACGGGACCTCACATTCTGTATTTGTCCCGATTGGCTAGCAACTTAGAACTTT
그리고 내 VCF 파일은 다음과 같습니다 :
Usage: cat ref.fa | vcf-consensus [OPTIONS] in.vcf.gz > out.fa
내 FASTA 파일입니다
##fileformat=VCFv4.1
#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT SAMPLE
7 1 . T A . . . GT 0/1
7 2 . G A . . . GT 0/1
7 3 . G A . . . GT 0/1
7 4 . C A . . . GT 0/1
은 내가 VCF를 tabix에 의해 bgzip 및 인덱스 압축 파일 :
bgzip vcfFile.vcf
tabix -p vcfFile.vcf.gz
그리고, 내가 실행 :
cat fastaFile.fa | vcf-consensus vcfFile.vcf.gz > out.fa
는이 오류를 얻을 : FASTA 파일에서 찾을 수 없습니다 "7"순서.
아는 사람 있습니까?
감사합니다. 당신의 FASTA 헤더 단지 인 경우 tabix 일하는 것이
수 'grep '^>'fastaFile.fa'의 결과를 보여줍니다. – Pierre
이며 http://www.biostars.org에 문의하십시오. – Pierre
@Pierre : 헤더는 다음과 같습니다. "> gi | 157696558 | ref | NW_001838997.1 | 호모 사피엔스 C 염색체 7 게놈 비계, 대체 어셈블리 HuRef SCAF_1103279187418, 전체 게놈 샷건 시퀀스 " – user3507782