2014-11-22 11 views
0

간단한 예제와 함께이 스크립트 (vcf-consensus)를 사용하려고하는데 하나의 오류가 있습니다. 시퀀스 "7"이 fasta 파일에서 발견되지 않습니다.Error vcf-consensus script

syntaxis은 다음과 같습니다

TGGCTGGAACGGGACCTCACATTCTGTATTTGTCCCGATTGGCTAGCAACTTAGAACTTT 

그리고 내 VCF 파일은 다음과 같습니다 :

Usage: cat ref.fa | vcf-consensus [OPTIONS] in.vcf.gz > out.fa 

내 FASTA 파일입니다

##fileformat=VCFv4.1 
#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT SAMPLE 
7 1 . T A . . . GT 0/1 
7 2 . G A . . . GT 0/1 
7 3 . G A . . . GT 0/1 
7 4 . C A . . . GT 0/1 

은 내가 VCF를 tabix에 의해 bgzip 및 인덱스 압축 파일 :

bgzip vcfFile.vcf 
tabix -p vcfFile.vcf.gz 

그리고, 내가 실행 :

cat fastaFile.fa | vcf-consensus vcfFile.vcf.gz > out.fa 

는이 오류를 얻을 : FASTA 파일에서 찾을 수 없습니다 "7"순서.

아는 사람 있습니까?

감사합니다. 당신의 FASTA 헤더 단지 인 경우 tabix 일하는 것이

+0

수 'grep '^>'fastaFile.fa'의 결과를 보여줍니다. – Pierre

+0

이며 http://www.biostars.org에 문의하십시오. – Pierre

+0

@Pierre : 헤더는 다음과 같습니다. "> gi | 157696558 | ref | NW_001838997.1 | 호모 사피엔스 C 염색체 7 게놈 비계, 대체 어셈블리 HuRef SCAF_1103279187418, 전체 게놈 샷건 시퀀스 " – user3507782

답변

0

는 VCF는 열 1

에 '7'염색체를 포함하지만 FASTA 헤더

>gi|157696558|ref|NW_001838997.1| Homo sapiens chromosome 7 genomic scaffold, alternate assembly HuRef SCAF_1103279187418, whole genome shotgun sequence 

입니다 :

>7 
+0

이것은 있습니다. 감사합니다. – user3507782