아래 코드는 다음 결과를 얻습니다. 예를 들어 와 $seq 세트 aaaGACGTCaaaGAATTCaaaGACGTCaaa에 : RE: AatII
GACGTC found at 4-9
GACGTC found at 22-27
RE: EcoRI
GACGTC found at 4-9
GACGTC found at 22-27
GAATTC found at 13-1
나는 분석 할 유전자 목록이 두 가지있다. 본질적으로 나는이 목록의 요소를 Venn 다이어그램과 같은 방식으로 정렬하려고합니다. 즉, 목록 1에서만 발생하는 요소는 하나의 목록에 배치되고 목록 2의 요소는 다른 요소에 포함되며 두 요소 모두에서 발생하는 요소는 제삼. 지금까지 내 코드 : from Identify_Gene import Retrieve_Dat
이 같은 문자열이있다 : M90I4D7 내가 구조체의 종류에 밀어해야합니다 struct CigarOp {
char Type; //!< CIGAR operation type (MIDNSHPX=)
uint32_t Length; //!< CIGAR operation length (number of bases)
//! constru
간단한 예제와 함께이 스크립트 (vcf-consensus)를 사용하려고하는데 하나의 오류가 있습니다. 시퀀스 "7"이 fasta 파일에서 발견되지 않습니다. syntaxis은 다음과 같습니다 TGGCTGGAACGGGACCTCACATTCTGTATTTGTCCCGATTGGCTAGCAACTTAGAACTTT
그리고 내 VCF 파일은 다음과 같습니다 : Usage
내가 게놈 FASTA 파일에서 시퀀스의 선반 파일을 만드는 오전에 : 자체는 2.6GB입니다 # Import necessary libraries
import shelve
from Bio import SeqIO
# Create dictionary of genomic sequences
genome = {}
with open("Mus_musculus.
나는 수많은 아미노산 서열을 ExPASy myristoylator에 자동으로 업로드하는 스크립트를 작성하려고하는데, 처음 부분에 문제가 있습니다. import mechanize
br = mechanize.Browser()
br.open("http://web.expasy.org/myristoylator/")
for i in br.forms():
JEnsembl로 아주 작은 프로젝트를 시작하고 있으며 새로운 API를 사용해 본 적이 없습니다. 왜이 문제가 발생했는지 궁금합니다. DBRegistry reg = DBRegistry.createUninitializedRegistryForDataSource(DataSource.ENSEMBLDB);
Eclipse에서는 ENSEMBLDB를 필드로 확인할 수
두 개의 문자가 첫 번째 시퀀스와 두 번째 품질을가집니다. 두 번째 품질은 첫 번째 시퀀스의 품질을 아래와 같이 보여줍니다. I는 다음과 같이 제 2 정보를 확장 그래서 1. ACT-GACTG-ACTG
2. KKKKKKKKKKKK
이하 (공간)뿐 1. ACTGACTGACTG
2. KKKKKKKKKKKK
(정렬) 제 1 시퀀스를 처리 한 후 그것을
한 줄로 여러 줄의 줄을 접으려고합니다. 내가 정규식 찾기 시도했습니다 >8445125
VSSSDEQPRPRRS
RNQDRQHPNQNRP
VLGRTERDRNRRQ
FGQNFLRDRKTIA
>8445125
VSSSDEQPRPRRSRNQDRQHPNQNRPVLGRTERDRNRRQFGQNFLRDRKTIA
예 [A-Z]는 \ n은 빈로 교체하십시오