저는 파이썬과 바이오 파이썬으로 시작하고 프로그래밍 경험이 많지 않습니다. 너희들이 나에게 줄 수있는 어떤 도움이라도 고맙게 생각한다. 나는 genbank에서 CDS 및/또는 rRNA 서열을 추출하려고합니다. 내가 독서 프레임을 얻는 것이 중요합니다. 그래서 전체 시퀀스를 가져 오는 것이 아닙니다. record = SeqIO.read(handle, "gen
편집 : 나는 나를 수 있도록하는 feature. 개체가 feature.type 유전자/CDS를 줄 것이다 feature.qualifiers 다음 등 "db_xref"/ "locus_tag"/ "추론"줄 알고 위치 (예 : [5240:7267](+))에 직접 액세스 하시겠습니까? 내 목적을 위해 그것을 사용하는 방법을 알아낼 수 없지만 이 URL http:
제 동료가 작업에 사용하는 GBK 파일의 시퀀스 부분에서 주어진 유전자 시퀀스를 가져 오기 위해 GenBank 파일과 Biopython을 사용하는 스크립트를 작성했습니다. 새 데이터 세트에 몇 가지 문제가 있었으며 다운로드 한 GBK 파일에 시퀀스가 들어 있지 않은 것으로 나타났습니다 (NCBI의 GenBank 웹 사이트에서 쉽게 다운로드 할 수 있음)
GenBank에서 GI 번호를 단계적으로 제거하고 다음 형식으로 헤더를 편집 한 위치에 여러 개의 fasta 파일이 저장된다는 경고가 계속 표시됩니다. >SomeText_ginumber
나는 다음과 같이 심지어 헤더 파일을이로 시작하지만 방법이 이상적으로 파이썬 함께, 내가 NCBI에서 각 GI에 해당하는 가입 번호를 얻을 수 있음을 출력 할 생각도 없
저는 Biopython을 처음 사용하고 있으며 genbank 파일을 구문 분석 할 때 성능 문제가 있습니다. 많은 수의 gb 파일을 구문 분석해야하는데, 여기에는 수납 번호가 있습니다. 구문 분석을 한 후에는 파일의 분류 및 조직을 조사하기 만하면됩니다. 내가 가지고있는 분류를 찾기 위해 위해 from Bio import SeqIO
from Bio imp
BioPerl을 사용하여 GenBank 파일에서 CDS 및 해당 아미노산 서열을 추출하려고합니다. 스크립트는 아래와 같습니다 while (my $seq_object = $in->next_seq){
for my $feat_object ($seq_object->get_SeqFeatures) {
if ($feat_object ->primary_tag
저는 Java에 익숙하지 않으며 GenBank 텍스트 파일을 FASTA 형식으로 변환 할 수있는 프로그램을 작성하려고합니다. 기본적으로 GenBank 형식 파일을 업로드 할 곳과 변환 된 FASTA 형식 파일을 표시하는 두 가지 texbox가 있습니다. 이은의 GenBank 형식의 파일입니다 LOCUS AB000263 368 bp mRNA line