2017-09-10 10 views
0

Blast +를 (os sierra)에 구성하고 로컬로 다운로드 한 내 nr 및 nt 데이터베이스를 구성하는 데 문제가 있습니다. 나는 NCBI의 지시 here을 따르려고 노력하고 있으며, 구성 및 예제 실행 단계에 익숙해 져 있습니다. 그것이 말하는 있도록폭발 + 로컬 구성 : nt 및 nr 데이터베이스를 구성하는 방법?

그들은 내 .bash_profile을 변경하는 말 : 잘 작동

export PATH=$PATH:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/ncbi-blast-2.6.0+/bin 

을, 그들은 BLASTDB에 대한 경로를 구성 말하고 "유사"하지만 내 DB가 될 것 파일에, 그래서 이런 짓을했는지 :

나는 그들의 FTP에서 NT tar 파일의 압축을 해제 할 때 내가 가진 정확한 폴더를 지정
export BLASTDB=$BLASTDB:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/blastdb/nt.00 

. 내가 명령을 실행하는 경우이 경로로 ...

blastn -query test_query.fa -db nt.00 -task blastn -outfmt "7 qseqid sseqid evalue bitscore" -max_target_seqs 5 

는 다음 성공적으로 실행하고 나는 결과를 얻을 수 있지만, 나는이 단지 전체 NT의 nt.00 부분에 대해 확인되고 있다는 걱정 .00 데이터베이스 파일, 특히 WebBlast에서 test_query.fa 시퀀스를 실행하면 다른 결과가 나옵니다.

또한 지침에 따르면 경로는 전체 데이터베이스 폴더 nt.00을 포함하는 폴더를 가리켜 야합니다. 즉, 압축 해제 된 tar 파일과 특정 nt.00 파일 자체가 아닌 폴더를 가리켜 야합니다. case는 단지 "blastdb /"("blastdb/nt.00 /"와 반대로, nt.00.nhd, , nt.00.nal 등을 포함합니다). 내가 일할 때 nt 데이타베이스에서 blastn을 할 수 있기를 원하고, nr 데이타베이스에서 blastp를 할 수 있기를 원한다. 내 명령에서 -db 플래그를 바꾸면 문제가 발생하지 않는다. 이 폴더에있는 모든 것, 맞죠? 그러나 nt.00 DB가 끝에 추가 된 BLASTDB의 경로를 지정해야한다면 어떻게 nr.00을 같은 폴더 (blastdb /)에 사용할 수 있습니까? 내 명령에 -db 플래그 다음에 그렇게 말

export BLASTDB=$BLASTDB:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/blastdb/ 

을 그리고 나는 내가 할 수있는 사용하기 원하는 데이터베이스에 따라 : 는 지시가 말한대로 기본적으로 내가하고 싶은, 그냥이 있습니다. 나는 위의 같은 경로를 할 때, 그것은 나에게이 오류 제공 :

BLAST Database error: No alias or index file found for nucleotide database [nt] in search path [/Users/LJStout::/Users/LJStout/Documents/Luke/Research/Pedulla 17-18/blast/blastdb:] 

내가로부터 위 같은 BLASTN 명령 있음을 실행하고 "nt.00"를 "NT"스와핑 시도를하고, 이러한 시도 "blastdb /"및 "blastdb/nt"와 물론 오류없이 실행되는 유일한 "blastdb/nt.00"둘 모두로 끝나는 BLASTDB의 경로가있는 명령입니다.

Here's an example 다른 실에서 OP 전체가 nt.00 폴더를 확인하지 않고 그의 처형에 대해 걱정하고있는 곳을 읽었을 때, 이것은 내 문제와 달랐습니다.

도움 주셔서 감사합니다.

+1

귀하의 정보를 원하시면, 생물 정보학 스택 체인 교환 사이트도 있습니다 : https://bioinformatics.stackexchange.com – bli

+0

고마워요, 제가 실수로 여기 게시했습니다. – ljs

답변

1

이 모든 문제는 해당 부모 폴더에 해당 .tar.gz 파일의 압축을 풀 때 발생하는 원래 폴더 인 nt.00 & nr.00 파일의 내용이 인 경우에 발생합니다. 동일한 상위 폴더 나는 단순히 그들이 들어온 폴더를 지우고 그 내용을 내 새로운 단 하나의 부모에게 복사했다. 지시에 의해 다소 오도되었습니다. 그것은 단순한 실수였습니다.자, 내가 사용하고자하는 모든 데이터베이스 (nt, nr 및 refseq 포함)의 모든 내용을 포함하는 하나의 폴더 blastdb/이 있습니다.