2014-08-29 6 views
0

Illumina NextSeq에서 실행 한 일부 .fastq 파일이 있습니다. 많은 서열은 poly-A 영역을 가지고있어이를 매핑하는 것을 복잡하게 만든다. 나는 10 연속 A의 모든 시퀀스를 제거하려면 다음과 같이 fastx_clipper 사용하여 그렇게하도록 노력 해왔다 :왜 fastx_trimmer는 내 fastq 파일이 알 수없는 파일 형식이라고 생각합니까?

ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L004_trimmed.fastq 

이 다음과 같은 오류 메시지가 결과는 :

fastx_clipper: input file (-) has unknown file format (not FASTA or FASTQ), first character = (10) 

내가 완전히 아니에요 이게 무슨 뜻인지.

ha5c6n8$ head FR0826_S1_L004_R1_001.fastq 

@NS500289:18:H1237BGXX:4:11401:2791:1023 1:N:0:1 
NCTACATTGGTTCCTCAGCCAAGCACATACACCAAATGTCTGAACCTGCGGTACCTCTCGTACTGAGCAGGATT 
+ 
#<<AAFAFFFAFFFFF7FF)FF.F<FAFFFFF<FF.AFFF7F.F.FFAFFFF)7AF7F<FFF<<F7FFFFFF7F 
@NS500289:18:H1237BGXX:4:11401:19266:1023 1:N:0:1 
NAATGGGTCTGCGAGAGCGCCAGCTATCCTGAGGGAAACTTCGGAGGGGGCCGGCTACTAGATGGTTCGCTTAGT 
+ 
#<7AAFAFFFFFFFF7FFAA.AFF<F...<AFFFF7F..FA.A<AA<F7)FA7.FF.<FA..F.A7AF..FFF.A 
@NS500289:18:H1237BGXX:4:11401:6297:1023 1:N:0:1 
NATAAGAGGGGTGTGGCTAGGCTAAGCGTTTTGAGCTGCATTGCTGCGTGCTTGATGCTTGTCCCTTTTGATCGT 

는 지금까지 내가 말할 수있는, 이것은 지극히 정상적인 fastq 형식의 파일과 같다 : 나는 머리를 사용하여 fastq 파일로 보았다. 누구든지이 오류의 원인을 설명 할 수 있습니까? 감사합니다.

+0

제 의견으로는이 질문은 stackoverflow에 적합하지 않습니다. 내가 너라면 fastq 유효성 검사기로 fastq 파일을 검사하고 경고 및 오류가 있는지 확인하여 디버깅을 시작합니다. 파일은 예 : 잘리지 않아도, 처음 몇 줄에서는 이것을 볼 수 없습니다. – cel

답변

0

fastq 파일은 허용되지 않는 새 행 (ASCII 값 10)으로 시작합니다. 첫 번째 줄을 삭제하면됩니다.